时间:2022-09-22 14:43:31 | 浏览:755
晓查 发自 凹非寺
量子位 报道 | 公众号 QbitAI
还记得你第一次用谷歌搜索引擎的时候,老师是怎么教你的吗?
在多个关键词中插入空格,比如你想搜一篇机器学习在医学上应用的论文,那么你就会在搜索框中输入“机器学习 医学”。
即使我们掌握了搜索引擎的使用技巧,有时候并不能返回最佳的查询结果。
比如搜索“2019年前往美国的巴西旅客需要签证”(2019 brazil traveler to usa need a visa)。
搜索引擎会关注“巴西”、“美国”、“签证”这些关键词,算法无法理解其中联系的重要性,就会返回有关前往巴西的美国人的无关搜索结果。
搜索的核心是理解语言。因此应该做到无论如何拼写或组合查询中的单词,都要弄清楚用户搜索的内容,并从网络上返回有用的信息。
这些年来,尽管谷歌在NLP领域取得了很多重大突破,但有时做得还不够好,尤其是在复杂或对话式查询中。
这也是人们经常使用“关键词”搜索的原因之一,但这并不是自然的提问方式。
用BERT改善搜索
去年,谷歌提出了一种被成为BERT的NLP技术,今日谷歌宣布将BERT用于自家的搜索引擎之中。
谷歌表示,这是过去五年中最大的飞跃,其中之一是搜索历史上最大的飞跃。
前面提到的查询“2019 brazil traveler to usa need a visa”,过去由于搜索引擎无法理解语义,不知道“前往”(to)在这句话中的重要性,因此返回了错误的结果。
在引入BERT后,谷歌就能掌握这一细微差别,并且知道单词“ to”在这里实际上很重要,并且为该查询提供更相关的结果。
这项突破是谷歌研究Transformer的结果:Transformer模型可处理与句子中与单词之间的关联,而不是一个接一个地单独处理单词。
因此,BERT模型可以通过查看单词前后的单词来考虑全部上下文,这对于理解搜索查询背后的意图尤其有用。
又比如,向搜索引擎提问:“Do estheticians stand a lot at work?” ,过去系统无法理解语句中“stand”的含义。
而BERT了解到“站立”(stand)是和“美容师”(estheticians)工作性质有关的词,从而返回了正确的结果。
在其他一些例子中,BERT可以帮助搜索引擎理解人类语音的一些细微差异,这在过去是计算机无法理解的。
哪些语言能用上
不仅英语国家能用上BERT改进后的谷歌搜索,谷歌表示还会将这项技术推广到其他语种,让更多语言的人用上。
BERT模型强大之处在于,它可以从一种语言中学习并应用于其他语言。因此,谷歌可以采用从大量英语中学习的模型,并将其应用于其他语言。
谷歌正在使用BERT模型来改进20多个国家或地区的搜索引擎,其中包括使用韩语、印地语和葡萄牙语等语言的地方。
仍有改进空间
最后,谷歌在宣传这项技术时,还大方承认了其中的一些缺陷。
比如搜索“哪个州位于内布拉斯加州以南”(what state is south of Nebraska),BERT会猜测你搜索的是“南内布拉斯加州”(South Nebraska)。
谷歌表示,语言理解仍然是一个持续的挑战,将会继续改进搜索。“我们一直在不断进步,并努力在你发送的每条查询中找到正确的含义(以及最有用的信息)。”
谷歌博客:
https://blog.google/products/search/search-language-understanding-bert/
— 完 —
量子位 QbitAI · 头条号签约作者
关注我们,第一时间获知前沿科技动态
最新的2021年11月搜索引擎占比显示:360搜索市场份额在1.84%,排名都在谷歌之后了。图:2021年11月搜索引擎市场份额占比数据来源:Statcounter作为一个中文搜索引擎,360走到现在这个地步实在是比较尴尬,至少曾经和百度搜
1:搜索引擎的运作原理网络搜索引擎优化(SEO)是一门融入了多种学科的交叉学科,用于使网站在"自然搜索"中更加靠前的技术。自然搜索是指非付费广告的形式,也就是说,通过SEO优化后的网站在搜索引擎中自然排名靠前。SEO主要有两个目标:近年来随
晓查 发自 凹非寺量子位 报道 | 公众号 QbitAI还记得你第一次用谷歌搜索引擎的时候,老师是怎么教你的吗?在多个关键词中插入空格,比如你想搜一篇机器学习在医学上应用的论文,那么你就会在搜索框中输入“机器学习 医学”。即使我们掌握了搜索
美国《连线》杂志在25周年庆典上,邀请了美国社会各界的大佬参与其中,谷歌CEO皮查伊在庆典上首次公开透露:中国市场“对我们来说很重要”,并且公开证实了正在研发一款中国版搜索引擎!谷歌CEO皮查谷歌正在为中国大陆研发一款“阉割版”的搜索引擎,
刚刚年满 20 岁的谷歌又一次在搜索领域扩大了自己的狩猎范围。今日,谷歌推出新的数据集搜索(Dataset Search)产品,希望帮助研究人员、记者和其他用户更轻易地获得这些数据。这一工具还提供以公开标准呈现的数据,从而帮用户清楚地了解这
360最近新推出了一个搜索引擎,名为“无追搜索”,宣称不收集和追踪用户个人隐私信息,也没有个性化广告、搜索界面更加简洁。下面我们来测试一下有没有其宣称的那么好。一、内容搜索体验比如,我们搜索“华为”。从下面的图可以看出,无追搜索的界面明显简
今年,谷歌开发者大会将于12月8日和12月14日分别在北京和上海举办。这是2011年谷歌在中国举办开发者大会之后的再次回归。12月8日(今天)上午9点,谷歌开发者大会(Google Developer Day - GDD)正式在北京国家会议
我们做SEO,新站除了去发外链吸引蜘蛛之外,另外一个吸引蜘蛛最简单直接的方法,就是去各大搜索引擎的入口提交网站,这是一个非常快速被收录的方法。悟道SEO把筛选了6个大家经常用到的搜索引擎网站提交入口,供大家使用。百度搜索网站登录口:htt
8月9日(周二),谷歌为8月8日搜索引擎中断问题道歉。该公司的一位发言人表示,该团队已“迅速开展工作”以解决故障,服务已恢复正常运行。此外,对于数据中心爆炸,Google发言人Devon Smiley向SFGATE发送了以下声明: “我们知
整理 | 祝涛出品 | CSDN(ID:CSDNnews)据报道,四家知名的搜索引擎呼吁欧盟委员会对谷歌采取进一步的反垄断行动,称谷歌在Safari和Firefox等网络浏览器上的默认地位,使其获得了不公平的竞争优势。这四家搜索引擎称他们尚
这两天有个客户问我,做外贸的除了谷歌这个之外还有哪些搜索引擎,我向他解释道谷歌的全球市场份额已经达到了百分之九十几,做谷歌就已经可以了。但是拗不过他的一再询问,我便把我所知道的搜索引擎(除了百度没说)都告诉了他。于是乎我也想把这些东西分享给
SERP 功能1.丰富的片段2.付费结果3.通用结果4.本地SERP5.垂直搜索6.知识图谱数据谷歌SERP工具1. WhatsMySerp2. RankWatch3. MozPro4. SerpBook5. Moz Local6. Sem
最近黑马看到一则消息,苹果即将推出自己家的搜索引擎。估摸听到这个消息,百度谷歌内心都会慌得一批。如果这个消息属实,以苹果Safari浏览器的用户量,苹果将成为全球前三的搜索引擎公司。这个消息也不是毫无根据,此前就时不时传出苹果要自己做搜索引
Google Scholar (GS)作为一个免费的学术搜索引擎,是谷歌搜索的学术版。GS数据库涵盖了大约2亿篇文章,基本上可以索引出世界上已出版的绝大部分学术期刊。不同于谷歌搜索,它不搜索网络上的所有索引信息,而更偏向于搜索出版商、大学或
谷歌搜索引擎今天引入多项改进,重点利用人工智能方式来帮助用户。这些改进包括为用户提供更具体的答案,更好地处理查询中的错字等等。此外谷歌还宣布对 Google Lens 和其他搜索相关工具的改进。大部分改进都是非常实用的是,而且其中有些也很有