1. 除了GOOGLE之外,还有哪个搜索引擎能够搜索外文网站
http://www.lib.tsinghua.e.cn/chinese/internet/s_engine1.html
Internet搜索工具列表
2. 搜索引擎是怎样判断原创的
搜索引擎判断复制网页一般都基于这么一个思想:为每个网页计算出一组信息指纹(Fingerprint),若两个网页有一定数量相同的信息指纹,则认为这两个网页的内容重叠性很高,也就是说两个网页是内容复制的。很多搜索引擎判断内容复制的方法都不太一样,主要是以下两点的不同:1、计算信息指纹(Fingerprint)的算法;2、判断信息指纹的相似程度的参数。在描述具体的算法前,先说清楚两点:1、什么是信息指纹?信息指纹就是把网页里面正文信息,提取一定的信息,可以是关键字、词、句子或者段落及其在网页里面的权重等,对它进行加密,如MD5加密,从而形成的一个字符串。信息指纹如同人的指纹,只要内容不相同,信息指纹就不一样。2、算法提取的信息不是针对整张网页,而是把网站里面共同的部分如导航条、logo、版权等信息(这些称之为网页的“噪音”)过滤掉后剩下的文本。分段签名算法这种算法是按照一定的规则把网页切成N段,对每一段进行签名,形成每一段的信息指纹。如果这N个信息指纹里面有M个相同时(m是系统定义的阙值),则认为两者是复制网页。这种算法对于小规模的判断复制网页是很好的一种算法,但是对于像google这样海量的搜索引擎来说,算法的复杂度相当高。基于关键词的复制网页算法像google这类搜索引擎,他在抓取网页的时候都会记下以下网页信息:1、网页中出现的关键词(中文分词技术)以及每个关键词的权重(关键词密度);2、提取meta descrīption或者每个网页的512个字节的有效文字。关于第2点,和google有所不同,google是提取你的meta descrīption,如果没有查询关键字相关的512个字节,而网络是直接提取后者。这一点大家使用过的都有所体会。在以下算法描述中,我们约定几个信息指纹变量:Pi表示第i个网页;该网页权重最高的N个关键词构成集合Ti={t1,t2,...tn},其对应的权重为Wi={w1,w2,...wi}摘要信息用Des(Pi)表示,前n个关键词拼成的字符串用Con(Ti)表示,对这n个关键词排序后形成的字符串用Sort(Ti)表示。以上信息指纹都用MD5函数进行加密。基于关键词的复制网页算法有以下5种:1、MD5(Des(Pi))=MD5(Des(Pj)),就是说摘要信息完全一样,i和j两个网页就认为是复制网页;2、MD5(Con(Ti))=MD5(Con(Tj)),两个网页前n个关键词及其权重的排序一样,就认为是复制网页;3、MD5(Sort(Ti))=MD5(Sort(Tj)),两个网页前n个关键词一样,权重可以不一样,也认为是复制网页。4、MD5(Con(Ti))=MD5(Con(Tj))并且Wi-Wj的平方除以Wi和Wj的平方之和小于某个阙值a,则认为两者是复制网页。5、MD5(Sort(Ti))=MD5(Sort(Tj))并且Wi-Wj的平方除以Wi和Wj的平方之和小于某个阙值a,则认为两者是复制网页。关于第4和第5的那个阙值a,主要是因为前一个判断条件下,还是会有很多网页被误伤,搜索引擎开发根据权重的分布比例进行调节,防止误伤。这个是北大天网搜索引擎的去重算法(可以参考:《搜索引擎--原理、技术与系统》一书),以上5种算法运行的时候,算法的效果取决于N,就是关键词数目的选取。当然啦,选的数量越多,判断就会越精确,但是谁知而来的计算速度也会减慢下来。所以必须考虑一个计算速度和去重准确率的平衡。据天网试验结果,10个左右关键词最恰当。后记以上肯定无法覆盖一个大型搜索引擎复制网页的所有方面,他们必定还有一些辅助的信息指纹判断,本文作为一个思路,给做搜索引擎优化的一个思路。小弟的站:合肥化妆摄影学校
3. 如果把百度搜索框放在自己的网站上当搜索引擎,请问这样会被告侵犯版权吗
不会侵犯版权,而且,网络还求着你把它的搜索放在你的网站,而且,还可以给你分钱的,这个不仅仅 网络,所有搜索引擎都希望自己的 搜索框放在别人的网站或者软件里面的,至于怎么放,在网络帮助里面直接有叫你怎么放的,如果不分钱的,直接在网络那里复制代码就可以的,如果是你要分钱的,就要申请网络联盟 审核过了才有钱的
4. 各大搜索引擎提供MP3 搜索是否无形中助长了盗版或侵权呢
是的, 现在网络盗版很严重, 因为在法律上来讲在网络上下载歌曲也需要缴纳版权费用的, 不过目前很少有缴纳这项费用的音乐网站, 可以说基本上没有, 所以给唱片公司带来的很大的损失.
不过我个人认为共享是互联网带给我们最大的一个好处, 如果以后在网上听歌也要收费, 估计再过不久我们就得为我们呼吸的空气缴费了...
5. 比百度搜索更全面的搜索引擎是哪
主要搜索引擎(独立的搜索技术) Google简体中文 http://www.google.com Google 的使命是整合全球范围的信息,使人人皆可访问并从中受益。完成该使命的第一步就是 Google 的创始人 Larry Page 和 Sergey Brin 共同开发的全新的在线搜索引擎。该技术诞生于斯坦福大学的一个学生宿舍里,然后迅速传播到全球的信息搜索者。 Google 目前被公认为全球最大的搜索引擎,它提供了简单易用的免费服务,用户可以在瞬间返回相关的搜索结果。 在访问 Google 主页时,您可以使用多种语言查找信息、查看新闻标题、搜索超过 10 亿幅的图片,并能够细读全球最大的 Usenet 消息存档,其中提供的帖子超过 10 亿个,时间可以追溯到 1981 年。 2005年,Google高调进军中国市场,推出Google搜索中国版,命名为:谷歌搜索 www.google.cn 网络搜索 http://www..com 网络搜索引擎拥有目前世界上最大的中文搜索引擎,总量超过3亿页以上,并且还在保持快速的增长。网络搜索引擎具有高准确性、高查全率、更新快以及服务稳定的特点,能够帮助广大网民快速的在浩如烟海的互联网信息中找到自己需要的信息,因此深受网民的喜爱。 雅虎中国 http://www.yahoo.com.cn/ 2005年11月9日 阿里巴巴公司在完成对雅虎中国的收购与整合之后,重新发布了进入中国市场7年之久的雅虎网站, 未来雅虎在中国的业务重点方向将全面转向搜索领域,这也是自8月11日阿里巴巴宣布收购雅虎中国时就从没改变的方向。阿里巴巴CEO马云表示: 阿里巴巴在搜索领域既有决心更有信心,在中国,雅虎就是搜索,搜索就是雅虎。 2006年8月,雅虎中国推出独立搜索引擎网站入口 www.yahoo.cn 中国搜索 http://www.zhongsou.com/ 中国搜索(原慧聪搜索)2002年正式进入中文搜索引擎市场,2003年8月24日慧聪搜索(现中国搜索)正式推出第三代智能中文搜索引擎.2003年12月23日慧聪搜索正式独立运作,成立中国搜索,陈沛出任CEO,同时推出中国搜索新闻中心。2004年2月26日中国互联网新闻中心、IDG集团注资中国搜索,成立合资公司。并提出"个人门户时代"的创新理念。2004年2月26日中搜桌面搜索引擎网络猪1.0版公开发布。实现主要功能:桌面搜索、个性化定制新闻专题、行业资讯、对接即时通(IMU)、自写短信功能、智能搜索(按照用户天气预报设置的城市,在目标城市范围内进行搜索),目前最新版本是3.0beta。中搜目前提供网页、新闻、行业、网站、Mp3、图片、购物、地图等搜索,其中行业搜索较有特色。 搜狗搜索 http://www.sogou.com/ 搜狗是搜狐公司于2004年8月3日推出的完全自主技术开发的全球首个第三代互动式中文搜索引擎,是一个具有独立域名的专业搜索网站--“搜狗”。以一种人工智能的新算法,分析和理解用户可能的查询意图,给予多个主题的“搜索提示”,在用户查询和搜索引擎返回结果的人机交互过程中,引导用户更快速准确定位自己所关注的内容,帮助用户快速找到相关搜索结果,并可在用户搜索冲浪时,给与用户未曾意识到的主题提示。 2004年8月3日,搜狐正式推出全新独立域名专业搜索网站“搜狗”,成为全球首家第三代中文互动式搜索引擎服务提供商。提供全球网页,新闻,商品,分类网站等搜索服务。 MSN中文搜索(测试版) http://beta.search.msn.com.cn/ 网页搜索功能不仅提供网页链接列表,而且能将您链接到您要查找的答案和信息。为实现这点,新的 MSN 搜索使用新的搜索引擎、索引和爬网软件,它们都是建立在 Microsoft 技术的基础之上的。 爱问搜索引擎 http://iask.com/ “爱问”搜索引擎产品由全球最大的中文网络门户新浪汇集技术精英、耗时一年多完全自主研发完成,采用了目前最为领先的智慧型互动搜索技术,充分体现了人性化应用理念,将给网络搜索市场带来前所未有的挑战。 “爱问iAsk”是新浪完全自主研发的搜索产品,采用了目前最为领先的智慧型互动搜索技术,充分体现人性化应用的产品理念,为广大网民提供全新搜索服务。 奇虎社区搜索引擎 http://www.qihoo.com/ 奇虎是全球智能化的中文社区论坛搜索引擎,致力于帮助网民从海量的互联网内容中便捷地获取信息;奇虎同时是一家专业搜索技术服务提供商,帮助各大社区论坛增加搜索功能、创新互动产品。奇虎与社区论坛创建共生、共赢的上下游产业链关系,共同缔造社区论坛搜索商业模式。 北京大学天网中英文搜索引擎 http://e.pku.e.cn/ Openfind搜索引擎 http://www.openfind.com.tw Openfind 创立于1998年1月,其技术源自台湾中正大学吴升教授所领导的GAIS实验室。Openfind起先只做中文搜索引擎,鼎盛时期同时为三大著名门户新浪、奇摩、雅虎提供中文搜索引擎,但2000年后市场逐渐被Bai和Google瓜分。2002年6月,Openfind重新发布基于GAIS30 Project的Openfind搜索引擎Beta版,推出多元排序(PolyRankTM),宣布累计抓取网页35亿,开始进入英文搜索领域,此后技术升级明显加快。 其它搜索引擎(非独立搜索技术) SOSO搜搜 http://www.soso.com QQ推出的独立搜索网站。提供综合、网页、图片、论坛、音乐、搜吧等搜索服务。 网易搜索引擎 http://so.163.com/ 网易在国内首创“网易开放式目录管理系统(ODP)”。提供网页搜索、分类网站、图片搜索、时尚搜索,其网页搜索结果由Google提供。 TOM搜索引擎 http://i.tom.com/ 提供网页、网站、图片、MP3、新闻搜索,其网页搜索结果由网络搜索提供。 21CN搜索引擎 http://search.21cn.com/ 提供网页、网站、图片、MP3、FLASH、电影、软件、影集搜索,其网页搜索结果由网络提供。 中华搜索 http://sou.china.com/ 2006年1月18日,中华网推出新版的搜索引擎网站,目前提供网页、新闻、本地、图片、音乐、论坛搜索等服务。
6. 搜索引擎侵权问题-图片库
这里面有一个避风港原则。
“避风港”原则是指在发生著作权侵权案件时,当ISP(网络服务提供商)只提供空间服务,并不制作网页内容,如果ISP被告知侵权,则有删除的义务,否则就被视为侵权。如果侵权内容既不在ISP的服务器上存储,又没有被告知哪些内容应该删除,则ISP不承担侵权责任。 后来避风港原则也被应用在搜索引擎、网络存储、在线图书馆等方面。避风港原则包括两部分,“通知+移除” (notice-take down procere)。[资政知识产权]
7. 搜索引擎会封杀含有js控件网页吗
搜索引擎一般不会去读取你的JS代码,搜索引擎对HTML代码的兴趣是最大的了,所以一般是没有人像你这么干的,如果非要这么做,建议你做好站点地图供搜索引擎去爬。
8. 网络十大搜索引擎
全球十大搜索引擎
许多搜索引擎利用 十大顶级搜索引擎 去查找它们所需要的查询结果。为了更好地进行网站推广,您最好将网站登陆至这十大搜索引擎中的一个或多个。为了让您的网站获得较好的排名,了解这些搜索引擎是如何评估您的网站排名要走很长的路。
MSN Search Microsoft 的 MSN Search, 由 LookSmart 支持,二级查询结果由 Inktomi 提供。 Overture (严格说是PPC搜索引擎) 将顶部的查询结果提供给 MSN. 为对 MSN 成功优化网站,那么必须仔细考虑 LookSmart 和 Inktomi 的排名要求。在某些情况下, Direct Hit 的查询结果也会体现在该搜索引擎上。
Yahoo 一致公认的最佳搜索引擎(严格说是份类目录),它的web查询结果来自Google(近期有所变更). 收录在它分类目录中的网站。其查询结果以分类目录的查询结果显示。商业站点收录至分类目录的年费用为299美金,它将用几周到几月的时间才会给您结果,告诉您网站最终是否被收录。
Google 免费搜索引擎。顶部搜索结果将列入 LookSmart, Yahoo, 及 Open Source Directory.
Google 非常关注外部链接,如故一个网站有较多质量较好的外部链接,将获得较高的排名。它的 AdWords/AdSelect 也将作为查询结果显示。
AOL Search 从 Google 搜索数据库中获得查询结果。想在 AOL 中获得好的排名应该关注 Google 的排名规则。
版权所有 网络营销文摘 powerd by 优网科技 保留所有权利,如您需要转载,请联系本网站,获得同意后再行转载.
Lycos 该分类目录搜索引擎查询结果来自 Fast/AllTheWeb, Overture 和 Open Source Directory.
Ask Jeeves 拥有人工编辑分类目录和来自 Teoma 的搜索引擎爬行结果。Overture 作为赞助商,查询结果也将出现在该搜索引擎的结果中。
LookSmart - Zeal 人工编辑搜索引擎分类目录,支持 MSN 及 Excite等较多的合作伙伴。
当 LookSmart 搜索无果时,由 Inktomi 提供搜索结果。
Overture 前身 GoTo.com, 严格来说是PPC搜索引擎。它的搜索结果将列入 Yahoo, MSN, Altavista 等搜索引擎。
Netscape Search 现在 NetScape 的查询结果来自于 Google.
AltaVista 对老的搜索引擎之一,至今任然在搜索引擎中占有重要地位。他有免费网站登陆及收费网站登陆两种。
Open Directory 该开放目录是志愿编辑人员预审的搜索引擎目录, 它的查询结果和 NetScape, AOL, Google, Lycos等共享。
Inktomi Inktomi 比较特殊,是唯一一个在网站上不提供搜索的搜索引擎,它是真正意思上为搜索引擎提供信息的搜索引擎,比如向 Hotbot, MSN, Overture等。它号称为搜索引擎的搜索引擎。它提供的 Inktomi PrioritySubmit 是网站推广较为经济实惠的方案.
9. 目前世界上最好的搜索引擎是什么
十大国际著名搜索引擎
MSN Search Microsoft 的 MSN Search, 由 LookSmart 支持,二级查询结果由 Inktomi 提供。 Overture (严格说是PPC搜索引擎) 将顶部的查询结果提供给 MSN. 为对 MSN 成功优化网站,那么必须仔细考虑 LookSmart 和 Inktomi 的排名要求。在某些情况下, Direct Hit 的查询结果也会体现在该搜索引擎上。
Yahoo 一致公认的最佳搜索引擎之一(严格说是分类目录),它的web查询结果来自Google. 收录在它分类目录中的网站,其查询结果以分类目录的查询结果显示。商业站点收录至分类目录的年费用为299美金,它将用几周到几月的时间才会给您结果,告诉您网站最终是否被收录。
Google 免费搜索引擎。顶部搜索结果将列入 LookSmart, Yahoo, 及 Open Source Directory.
Google 非常关注外部链接,如果一个网站有较多质量较好的外部链接,将获得较高的排名。它的 AdWords/AdSelect 也将作为查询结果显示。
AOL Search 从 Google 搜索数据库中获得查询结果。想在 AOL 中获得好的排名应该关注 Google 的排名规则。
Lycos 该分类目录搜索引擎查询结果来自 Fast/AllTheWeb, Overture 和 Open Source Directory.
Ask Jeeves 拥有人工编辑分类目录和来自 Teoma 的搜索引擎爬行结果。Overture 作为赞助商,查询结果也将出现在该搜索引擎的结果中。
LookSmart - Zeal 人工编辑搜索引擎分类目录,支持 MSN 及 Excite等较多的合作伙伴。
当 LookSmart 搜索无果时,由 Inktomi 提供搜索结果。
Overture 前身 GoTo.com, 严格来说是PPC搜索引擎。它的搜索结果将列入 Yahoo, MSN, Altavista 等搜索引擎。
Netscape Search 现在 NetScape 的查询结果来自于 Google.
AltaVista 最老的搜索引擎之一,至今仍然在搜索引擎中占有重要地位。它有免费网站登陆及收费网站登陆两种。
Open Directory 该开放目录是志愿编辑人员预审的搜索引擎目录, 它的查询结果和 NetScape, AOL, Google, Lycos等共享。
Inktomi Inktomi 比较特殊,是唯一一个在网站上不提供搜索的搜索引擎,它是真正意思上为搜索引擎提供信息的搜索引擎,比如向 Hotbot, MSN, Overture等。它号称为搜索引擎的搜索引擎。它提供的 Inktomi PrioritySubmit 是网站推广较为经济实惠的方案.