admin管理员组

文章数量:1532347

  不需要多次搜索就能找到尽可能多的结果,并自动过滤部分重复内容,更加高效便捷的搜集数据和问题答案。也可以用来总结2021年以前出版的各种有影响力的书籍,在有限时间里了解各种书籍,丰富知识储备。由于需要进行多次搜索以获取更多数据,因此可能需要等待几分钟,但是,这个等待是值得的。
  本功能还将搜索结果的概要整理到最后,方便需要把问题进一步根据这些概要搜索时复制使用。
  [入口](https://min-ti/quicksearch)
  首页是gpt聊天模式
  代码分享,采用了循环就一个问题多次提问,然后去除重复的内容。
 去重的方法, 把回复的每一项分为,概要和正文,用python的difflib库来比较每一项的概要和正文的相似度,结合两个相似度判断每一项是否有重复,重复的过滤不要。
 返回内容时要每一项的概要用逗号拼接在一起返回,方便用户复制粘贴就概要进一步提问
 比较是否相似的部分代码:
if s22 and s11:
  seq = difflib.SequenceMatcher(None, s1, s2)

  seq1 = difflib.SequenceMatcher(None, s11, s22)
  if seq.ratio()>0.9 and seq1.ratio() > 0.21:
   return True
if s2==s1:
   return seq1.ratio() > 0.15
if len(s2)>=2 and len(s2)<=5 and s2==s1:   
	  return True
if len(s2)==4 or len(s1)==4:
   if seq.ratio()==0.5 and seq1.ratio() > 0.33:
	   return True  

本文标签: 自定义可以用来答案功能数据