注册
登录
搜索
标签
帮助
无线搜索论坛
无线搜索技术
第三代搜索引擎技术与P2P
上一主题
下一主题
发新话题
发布投票
发布商品
发布悬赏
发布活动
发布辩论
发布视频
打印
第三代搜索引擎技术与P2P
NapolLee
少校
个人空间
发短消息
加为好友
当前离线
1#大 中小 发表于 2008-2-28 19:10 只看该作者
第三代搜索引擎技术与P2P
第二代搜索引擎虽然比第一代在搜索速度、针对多种语言信息的扩展等方面有所改进,在以自然语言为查询语言方面也做了一些探索。然而,随着Internet的强势发展,网上庞大的数字化信息和人们获取所需信息能力之间的矛盾日益突出。IDC在2001年下半年公布的一份报告表明,前期被大肆宣传为“使用简便易用,搜索结果丰富”的搜索引擎技术正在被信息更集中的局域网取代,因为大多数搜索系统的表现与用户的期望值相差太大,诸如数据量高速增长的视频、音频等多媒体信息的检索,现在仍然是无法突破的难题。
一般的公共搜索引擎只能查到HTML格式,主要的原因是搜索引擎的自动排序软件Spiders蜘蛛程序,只能接受这种格式的网页。这意味着,在企业内部的局域网上,任何没有使用HTML格式的信息将无法被外部的搜索引擎查到。这就是为什么像PPT、Word、PDF、电子邮件等文件,以及ERP、CRM等应用软件的数据库的信息会长期的“沉没”在信息的海底中。
如何解决这些难题已成为第三代搜索引擎探索的方向。一个好的搜索引擎不再仅凭借数据库大小、更新频率、检索速度、对多语言的支持这几个基本特性来衡量,随着数据库容量的不断膨胀,如何从庞大的资料库中精确地找到正确的资料,被公认为是下一代搜索技术的竞争要点。比如在某搜索引擎中查询“旅游”这个词,返回的信息超过一百万条,假定一个人3秒钟查看一个网页,就算只查看其中10%的网页,一刻不停地看下去也需要十多个小时。
好在搜索引擎技术发展迅速,诸如智能化、个性化特色的新型引擎与过去的搜索引擎相比有了很大的区别。智能搜索可以通过对搜索内容相关性的自动学习,来提高搜索结果的准确度。不过,现在还没有一种可行的方式真正实现智能化,很难将所需信息一定显示在前两三页的搜索结果之中。
另一个颇受瞩目的搜索技术就是将P2P技术应用到网页的检索中。通过共享所有硬盘上的文件、目录乃至整个硬盘,用户搜索时无需通过Web服务器,不受信息文档格式的限制,即可达到传统目录式搜索引擎无可比拟的深度(传统引擎只能达到20%~30%的网络资源)。美国一家新兴搜索引擎设计公司i5 Digital在两年前已正式推出了依据对等搜索理念的商业性搜索引擎Pandango(www.pandango.com
),但至今仍未进入主流搜索引擎阵容的事实,则说明P2P搜索目前也只能称为是未来的技术。
“P2P搜索这个理念我最早是1997年底在Infoseek听到的,当时的Infoseek里已经有人提出并开始考虑这种搜索技术了”,李彦宏表示,“各个网站上都有一个自己的小的搜索引擎,大家相互之间可以进行沟通,如果这个引擎查不到,可以通过其他的引擎查,就是这样的一个概念。但是到目前为止,它离实际的应用还差得非常远,主要是违反了关键性指标中有关速度的问题。由于有很多这种小的相互独立又相互链接的引擎,其速度与集中式管理的搜索引擎相比肯定会差很多”。
商业应用与学术研究之间总会存在一定的距离,但这并不是表示商业界不重视对技术的追求,尤其是像Google这些已经处于该领域金字塔塔尖的公司。Google拥有一个开放性数据库,内含一百多个未来需要实施的项目,这些项目由五十位计算机科学博士负责推进。2002年6月,Google专门成立了“实验室”,以展示他们在互联网搜索领域里最新研究的技术,并发布在互联网(labs.google.com)上供公众试用,广泛收集用户的反馈意见。实验室里已经展示的项目,包括键盘检索、语音检索等等。
或许有些人会认为,这些所谓的实验项目似乎看不出搜索引擎技术将在观念上进行大的转变,实际上,搜索引擎技术在8年多的时间里一直是以一个渐变的过程在发展。“一个搜索引擎并不是说某一方面好就能受大众喜欢,必须方方面面做到了才行”,李彦宏这么认为,“现在搜索还不能完全满足人们的需求,因为需求太多样化,很难一一满足”。这也是主流搜索引擎目前更重视在细节上下功夫的原因。
无论如何,包括Google的佩杰在内的搜索技术领域的领先者都认为,最终的搜索引擎将是智能化的,能够理解世界上的所有事物。佩杰还是Web服务技术领域积极的参与者,他正在尝试将Web服务技术应用到搜索当中,以解决跨平台、多格式的信息检索。而我们现在所见到的,主流搜索技术把注意力集中在提升自身搜索引擎质量、扩展应用范围,比如支持图片检索、PDA等移动手持设备的检索,这些都将成为下一代技术实现过程中必不可少的步骤。
UID793 帖子638 精华9
积分3906 财富12478 贡献1264 威望13 阅读权限10 性别男 来自广东 在线时间126 小时 注册时间2007-10-6 最后登录2008-10-4
查看详细资料
TOP uupd0fqoo
新兵
个人空间
发短消息
加为好友
当前离线
2#大 中小 发表于 2008-5-23 16:26 只看该作者
太好了
强强强~~~~~~~~~~~,太好了,谢谢
There is buy wow gold
web; you can buy really cheap wow gold here.Buy professional power leveling services,Cheap WoW Gold
,Cheap WoW Gold
,Cheap WoW Gold
,Cheap WoW Gold
,
光阴似箭
UID1572 帖子2 精华 积分7 财富30 贡献2 威望0 阅读权限1 性别女 在线时间0 小时 注册时间2008-5-22 最后登录2008-5-23
查看个人网站
查看详细资料
TOP dengpeiwen
列兵
个人空间
发短消息
加为好友
当前离线
3#大 中小 发表于 2008-11-19 11:25 只看该作者
p2p现阶段还是有技术瓶颈的,期待能有所突破吧
UID1882 帖子27 精华 积分60 财富60 贡献27 威望0 阅读权限3 性别男 在线时间4 小时 注册时间2008-10-23 最后登录2008-12-11
查看详细资料
TOP 北京国际机票
列兵
个人空间
发短消息
加为好友
当前离线
4#大 中小 发表于 2008-11-27 00:55 只看该作者
北京到喀土穆机票
北京到喀土穆机票$北京飞喀土穆特价机票$城市介绍
北京到圣多美机票$北京飞圣多美特价机票$城市介绍
北京机票
UID1603 帖子17 精华 积分52 财富180 贡献17 威望0 阅读权限3 性别女 在线时间0 小时 注册时间2008-5-28 最后登录2009-1-6
查看个人网站
查看详细资料
TOP chongziwz8
下士
个人空间
发短消息
加为好友
当前离线
5#大 中小 发表于 2008-11-30 01:10 只看该作者
管板坡口机
本系列管板坡口机
是本公司技术人员经过多年潜心研发的新一代管板坡口机具,能对管子和平板坡口,亦可铣削,而且对铜、铝等有色金属的坡口加工有着不可替代的<a href="http://www.hanjiemaimai.com/pokouji.html">坡口机</a>优势。
UID1940 帖子34 精华 积分103 财富350 贡献34 威望0 阅读权限4 在线时间0 小时 注册时间2008-11-11 最后登录2008-12-26
查看个人网站
查看详细资料
TOP chongziwz8
下士
个人空间
发短消息
加为好友
当前离线
6#大 中小 发表于 2008-12-2 12:34 只看该作者
先导式电磁阀的原理和特点
先导式电磁阀
,通电时,电磁力把先导孔打开,上腔室压力迅速下降,断电时,弹簧力把先导孔关闭,流体压力推动关闭件向下移动,关闭阀门.先导式<a href="http://www.samsonshanghai.com/diancifa.html">电磁阀</a>特点: 流体压力范围上限较高,可任意安装(需定制)但必须满足流体压差条件.
UID1940 帖子34 精华 积分103 财富350 贡献34 威望0 阅读权限4 在线时间0 小时 注册时间2008-11-11 最后登录2008-12-26
查看个人网站
查看详细资料
TOP 半只猫3303
新兵
个人空间
发短消息
加为好友
当前离线
7#大 中小 发表于 2008-12-4 01:50 只看该作者
QQ站顶起,楼主的文章很精彩,我喜欢。
今天改了QQ资料
,又找了一个QQ空间播放器代码
来装我的QQ空间日志
QQ空间播放器代码
UID1996 帖子4 精华 积分13 财富50 贡献4 威望0 阅读权限1 在线时间0 小时 注册时间2008-11-20 最后登录2008-12-4
查看个人网站
查看详细资料
TOP 上一主题
下一主题
控制面板首页
编辑个人资料
积分记录
公众用户组
升级个人空间
当前时区 GMT+8, 现在时间是 2009-1-9 19:07 粤ICP备07021541号
清除 Cookies
- 联系我们
- 无线搜索论坛
- Archiver
- WAP
- TOP
Powered by Discuz!
6.0.0 (C) 2001-2007 Comsenz Inc.
内页
内页
内页
直接浏览
提示:以上根据您的指令使用Timewe浏览服务访问的www.wxss.org网站,其内容、服务或立场跟Timewe无关
...
欢迎举报存在违法、不良信息的网站,净化网络环境
Wap推荐:
极品游戏大作