bing搜索引擎的核心算法官宣,可以加速智能算法

《Machinelearning(机器学习)》是眼下一类非常热门书籍,因为人工智能的兴起。许多站长们可能会明显的感觉到,近一个月来,许多品相好的文章bing搜索收录会快,甚至大量秒收。事实上,5月份微软官方就对外宣布和开源了部分必应搜索引擎的核心算法,声称这一算法能快速的将搜索结果反馈给用户。其基本搜索逻辑是:获得网站网页资料,建立数据库并提供查询的系统,搜索引擎的数据库是依靠一个叫“网络机器人(crawlers)”或叫“网络蜘蛛(Spider)”的软件,通过网络上的各种链接自动获取大量网页信息内容,并按一定的规则分析整理形成的。

微软希望通过开放这项技术,开发人员能够利用这项技术为其他用户搜索大量数据的用户提供类似的体验。

要知道搜索引擎在海量的数据中筛选出我们想要的数据是非常困难的,尤其是能做到毫秒级的响应,其背后的核心算法,是由一群数据科学家团队维护的。

微软bing开源的软件是微软开发的一个库,它可以更好地利用它收集的所有数据,为Bing引擎构建的AI训练模型。该算法称为空间分区树和图(SPTAG),使用开源的Python库为核心;允许用户利用深度学习模型的智能来搜索数十亿条信息,可以实现毫秒级的“矢量”搜索;用于更快地向用户提供更相关的结果。

“矢量搜索”可以更好低理解用户意向,而不是根据关键字匹配。矢量化工作可以加快和优化收录判断速度,从超过1500亿条数据中,更快速匹配关键字,这些匹配包括单个单词,字符,网页代码段,和其他媒体图片,一旦用户搜索点击后,可以加速准确的搜索结果提供。

#现在前往

精选留言

bing,搜索引擎,心算,法官
sample
2020-09-19
写留言
签到
投稿
QQ咨询
返回顶部