最贵的测试题来了——巴德答错了一个问题,谷歌市值蒸发超过7100亿元

钱江晚报·小时新闻记者 张云山

当地时间周三,谷歌大跌超7%,市值蒸发约7192亿元人民币。此前谷歌人工智能聊天机器人Bard在一场发布会上对用户提出的问题给出错误回答。

谷歌推出ChatGPT的竞品Bard。谷歌表示,Bard是一项实验性对话式AI服务,由LaMDA提供支持。Bard使用谷歌的大型语言模型构建,并利用网络信息。谷歌将其聊天机器人描述为“好奇心的发射台”,称它有助于简化复杂的话题。

有提问问道,“关于詹姆斯·韦伯太空望远镜(JWST),我可以告诉我9岁的孩子它有哪些新发现?”对此,Bard给出了很多答案,其中一个包括,太阳系外行星的第一张照片,是用JWST拍摄的。然而,这个答案是不准确的。根据美国国家航空航天局(NASA),2004年,欧洲南方天文台的甚大望远镜(VLT),拍摄了第一张系外行星照片。

Bard犯下事实性错误,谷歌股价大跌7.68%,市值蒸发1059亿美元(约合人民币7192亿元)。

而作为ChatGPT的受益方,微软早盘一度上涨3.4%,市值重回2万亿美元,为去年8月来首次。

微软周二推出了新的人工智能搜索引擎必应(Bing)和Edge浏览器。据悉,新版必应基于OpenAI的语言模型运行,但比ChatGPT更加先进,可以轻松地切换到人工智能聊天模式。而新的Edge浏览器增加了可以聊天和写作的必应。

除谷歌外,ChatGPT概念股的百度跌近5%,知乎盘中一度跌超9%,报收平盘。

本文为钱江晚报原创作品,未经许可,禁止转载、复制、摘编、改写及进行网络传播等一切作品版权使用行为,否则本报将循司法途径追究侵权人的法律责任。

谷歌推出了一系列新的人工智能功能:地图识别搜索、iOS翻译更新和地图沉浸式

智东西

作者 | ZeR0

编辑 | 漠影

智东西2月9日报道,昨夜,谷歌在巴黎直播活动上宣布了一系列人工智能(AI)相关进展,涉及搜索、翻译和地图应用。

跟微软同日发布的嵌入ChatGPT功能的新版Bing相比,谷歌发布的内容略显“温和”,仅对周一公布的对话式AI聊天服务Bard做了非常简短的演示,更多将重心放在介绍Google Len、翻译和导航体验的优化上。

一、翻译:Google Lens每月使用量超100亿次

Bard构建于谷歌对话式AI语言模型LaMDA的轻量级模型版本之上,目前仅对“受信任的测试人员”开放。谷歌的态度一如既往很谨慎,并没有透露计划何时公开,估计是打算等Bard足够完善后再正式发布。

现场谷歌做了个简短的Bard演示,比如询问观星时最佳星座建议,生成式AI能够生成直观的搜索结果。看起来跟微软新版Bing的聊天功能大差不差。

谷歌搜索的许多功能都是由AI驱动的。谷歌基于图像识别和OCR技术的AI应用Google Lens的每月使用量已超过100亿次。

谷歌高级副总裁Prabhakar Raghavan认为Google Lens将“超越传统的搜索概念”,比如当你购物时,方便你找到与目标物相似的产品。

“多重搜索”功能使用Google Lens照片和文本输入

谷歌将在安卓手机上推出“搜索屏幕”功能。只需长按安卓手机上的主页按钮,就能调出谷歌助手和“搜索屏幕”选项,无需离开当前应用程序,即可执行搜索功能,了解有关它们的更多详细信息。该功能适用于照片、视频、网站和应用程序。

安卓上新的“搜索屏幕”功能

谷歌“多重搜索”(Google Multisearch)功能将使得用户能够根据图像本身获得更多信息和上下文。借助这一功能,你可以为想要购买的产品拍照,然后为其输入不同的颜色。这个功能正在改进中,将在全球范围推出。

“多重搜索”功能将在移动设备的搜索结果页面上运行

还有跟艺术文化相关的AI新功能,比如搜索数千位艺术家的名画,并对其进行细致入微的研究。

二、翻译:iOS应用功能和用户界面更新

超过10亿人正在使用谷歌翻译。一种新的Zero-shot机器翻译技术,无需传统训练方式即可学习翻译成另一种语言。谷歌用这种方法增加了对24种新语言的翻译支持。

目前谷歌正在改进英语、法语、德语、日语和西班牙语的上下文翻译,具有多重含义的单词和短语将根据文本的上下文进行翻译,让译句更加自然。这项更新将在未来几周推出,并会在未来几个月内支持更多的语言。

去年,谷歌更新了安卓版谷歌翻译,现在iOS应用功能和用户界面也进行了更新,并新增了对33种语言的离线翻译支持。更新后的App在底部中心有一个大麦克风,用户语音输入文本更方便。

此外,新App设计添加了手势,比如向下滑动以访问最近的翻译和按住语言按钮以快速选择最近使用的语言。

三、地图:导航更加一目了然

谷歌的“沉浸式视图”(immersive view)功能使用AI技术融合了数十亿张街景和航拍图像,创建了一个世界的数字模型,并添加有不同图层,方便用户快速查看不同天气下的地标和交通状况。

该功能还可以显示某个地方的繁忙程度、进入路线以及附近有哪些景点。沉浸式视图将率先在伦敦、洛杉矶、纽约、旧金山和东京提供。阿姆斯特丹、都柏林、佛罗伦萨和威尼斯将在未来几个月内获得该功能。

谷歌地图的AR功能已经被广泛应用。只需打开手机摄像头,对准周边环境,数字信息就会显示在屏幕上。比如当你将摄像头对准某家咖啡店,你可以在手机屏幕上看到这家店的评论。

还有面向机场、火车站和购物中心等室内环境的“室内实时视图(Indoor Live View)”功能,用AR箭头进行导航,帮助用户更快找到附近的餐馆、自动取款机或交通枢纽,生活更加便利。谷歌未来几个月将在各地机场、火车站和购物中心新增1000个站点。

在导航方面,谷歌也面向电动汽车车主推出了新的地图功能,让AI推荐最佳充电站,它会考虑到交通、充电水平和旅行的能耗,并会突出显示“非常快速的充电站”,帮助消除“里程焦虑”。

结语:AI+AR,正让生活越来越便利

总体来看,谷歌今天公布的一系列进展,可以用“让生活更便利”加以概之,搜索调用更加轻便高效,翻译功能支持更多国家,地图借助AI和AR功能将导航视觉化,让找路变得更容易。

当然期待值最高的还是谷歌在AI搜索和聊天功能方面的动向,虽说Bard仍处在有限测试状态,但在微软Bing的刺激下,相信无论是Bard还是加入聊天功能的谷歌搜索,发布之日都不远了。

谷歌巴德推翻了,事实上,“严肃的废话”是人工智能的最大弱点

在试图追上微软和OpenAI在人工智能方面的先发优势时,谷歌自己搞砸了。

2月8日,谷歌人工智能聊天机器人Bard在发布会上对用户提出的问题给出错误回答。8日晚,美股开盘,谷歌大跌超7%,市值蒸发约1020亿美元(约6932.50亿元人民币)。

有分析认为,这正好暴露了类似的人工智能系统实际上并不具备“理解能力”,也很难甄别虚假信息,“一本正经的胡说八道”就是AI最受质疑的软肋。

AI犯了一个价值千亿美元的错

2月8日,谷歌在巴黎召开的发布会上再一次展示了Bard——这款为了对抗ChatGPT推出来的聊天机器人。按照谷歌的宣传,Bard不仅要和ChatGPT一样有问必答,还要更“负责任”——暗搓搓地指ChatGPT里掺杂的虚假信息太多,不够“负责”。

这一宣传明显提高了人们对于Bard的期望值。毕竟在最初的惊艳过后,ChatGPT“一本正经”的胡说八道,也就是回答里夹杂的不少似是而非的伪信息,已经让很多人对于使用它提高了警惕,里面逻辑和数学上的错误更加惊人。

让人没想到的是,谷歌的Flag立得太早。Bard刚一亮相,就出错了——而且出了个大糗。

在谷歌短短的几秒展示里,Bard其实只被问了一个问题——“我可以告诉我 9 岁的孩子关于詹姆斯·韦伯太空望远镜(James Webb Space Telescope ,简称JWST) 的哪些新发现?”

Bard的回答很精彩——有丰富的信息,而且很形象的比喻,确实深入浅出地给孩子解释了JWST的发现。

然而,里面有一个巨大的错误:回答里提到“ JWST 拍摄到了太阳系外行星的第一张照片”,也就是下图灰线部分。

然而,事实上,第一张系外行星照片是由欧洲南方天文台的Very Large Telescope (VLT) 在 2004 年拍摄的。

最先指出这个错误的是天体物理学家 Grant Tremblay。

他在推特上写道:“我不是要成为一个讨厌鬼,我相信 Bard 会令人印象深刻,但郑重声明:JWST 并没有拍下‘我们太阳系外行星的第一张图片’。”

天文学家们认为,这一问题可能源于人工智能误解了“模棱两可的NASA新闻稿,低估了过去的历史”。

而在唯一的一次演示里,就犯了这么大的错误,谷歌可以说颜面尽失,不得不快速撤下了相关演示的视频。

但错误已经犯了,代价就不可避免。消息一传出,谷歌股票大跌,市值蒸发约1020亿美元(约6932.50亿元人民币)。

可以说,这是AI到目前为止犯下的最昂贵的一个错误。

聊天机器人就是“扯淡生成器”

对于谷歌这场翻车的发布会,《每日电讯报》在报道中直接写道,Bard的错误将进一步引发人们去质疑搜索引擎和人工智能生成答案的准确性。

其实,对于聊天机器人的准确性,此前已有人工智能分析师警告称,生成式人工智能(generative AI)仍然存在潜在问题,例如,ChatGPT它的回复中有时会包含虚构事实。研究聊天机器人缺陷的华盛顿大学教授Chirag Shah此前表示,“公司经常过快地推出新技术,忽视它们的缺陷,然后又试图快速修复它们……这会造成真正的伤害。”

正如 Tremblay 所指出的,ChatGPT 和 Bard 等 AI 聊天机器人的一个主要问题是它们倾向于自信地将不正确的信息陈述为事实。这些系统经常“产生幻觉”,即编造虚假信息,因为他们只是接受大量文本语料库的训练,但并不是查询已经过验证的事实的数据库来回答问题。

也有网友评价说,这也正是如今的AI研究和语言模型共有的问题:它们非常擅长生成“看起来”准确的,但其实并不准确的信息。概括来说,他们就是在一本正经的胡说八道。

这导致一位著名的 AI 教授,将这些聊天机器人称为“扯淡生成器”。

很明显的一个例子就是,对于Bard犯错的这个问题,其实Google搜索已经给出了正确答案。

如果你在Google上搜索“太阳系外行星的第一张图片”,Google自己就给出了准确信息——它是在2004年由VLT第一次捕捉成像。

把检验真伪的责任丢给用户?

另一个巨头微软已经预见到了这样的事情发生。

就在谷歌发布会的前一天,微软也召开了一场发布会,宣布推出搭载了AI技术的搜索引擎必应(Bing)和浏览器Edge,新版本中引入了OpenAI旗下ChatGPT的相关技术,升级后,用户可以直接提出问题,并通过搜索引擎生成答案。

但是,微软在演示集成了ChatGPT的人工智能Bing搜索引擎时,就试图通过把责任丢给用户来避开同样的这些问题。它在免责声明里称,“Bing由AI提供支持,因此可能会出现意外和错误。请确保进行事实核查并分享反馈,以便我们学习和改进!”

在周一官宣Bard发布的博文里,谷歌CEO皮柴曾特别强调,谷歌希望通过这一阶段的测试,来提高Bard的质量和速度,确保 Bard的回答达到高标准。然而,在这个望远镜乌龙事件后,谷歌发言人不得不强行挽回一点颜面。他们告诉媒体称:“这凸显了严格测试过程的重要性,我们本周将通过 Trusted Tester 计划启动这一过程。我们会将外部反馈与我们自己的内部测试相结合,以确保Bard的回应在质量、安全性和现实世界信息的基础性方面达到高标准。”

AI还面临版权和伦理等诸多争议

需要强调的是,越大的公司对声誉和社会责任的顾虑越多。

去年11月,Meta具有1200亿参数语言模型Galactica,在生成内容里引用文献时,发生作者真实存在但文献虚构,以及还存在一本正经胡说八道的情况。事态引起舆论哗然,短短3天后,饱受争议的团队无奈宣布Demo(暂时)下架。

前车之鉴,还有2022年同样爆火的AI绘画。当时玩得最开的,当属Stable Diffusion背后的公司Stability AI。

虽然用户在用其进行AI绘画时得按需付费,但它开放源代码,开发者可以完全免费下载底层代码来训练自己的模型。开放性像一柄双刃剑,让Stability AI陷入了版权、监管等诸多争议之中。

另一边,伦理、版权多重顾虑缠身的OpenAI旗下DALL-E2、谷歌Imagen,在藏着掖着地隔岸观望后,才下场公测。结果么,两家都跌了跟头。

也正因如此,OpenAI才痛定思痛,推出ChatGPT来抢占先机。

但是,有媒体指出,哪怕是接受了两个多月的外部测试反馈和内部调试,ChatGPT仍然会不受控地口出狂言,发表一些政治偏向或种族和性别主义歧视言论,也被人们发现了会提供错误信息。尽管OpenAI没有提供错误信息频率的统计数据,但这家公司表示,会通过定期更新使该工具变得更好。

而在微软发布的必应的例子中,聊天机器人的答案将被降级到页面的一侧,而不是通常搜索结果将保留的前面和中心。机器人的回答还包括脚注和来源材料的链接,这在ChatGPT当中是没有的,但这使得微软的工具看起来更值得信赖。

反观谷歌的Bard,回答放在页面中间、搜索结果上方显示了单一的摘要答案,并且没有脚注,这意味着用户不可能识别来源。

OpenAI等公司试图通过增加数十亿个参数来提高语言模型的准确性,但一些研究人员怀疑,随着模型的增长,准确性的回报会递减。

对于正在进行AI大战的科技巨头们来说,消除这些持续存在的少数谎言可能成为一项长期挑战。

上游新闻综合自同花顺财经、投资界、新浪科技、澎湃新闻、华尔街见闻

编辑:陈璐

责编:张松涛

审核:冯飞

一个价值1200亿美元的错误!Google Bard暴露了“类似ChatGPT的应用程序”的最大弱点?

谷歌为了应对ChatGPT而自信推出的Bard,迅速被指出犯了低级错误,这暴露了类似的人工智能系统实际上并不具备“理解能力”。

华尔街见闻稍早时候曾介绍,有专家指出Bard在该产品的第一个演示视频中犯了一个“事实错误”。

在视频中,Bard回答了一个关于通过詹姆斯韦伯太空望远镜获得的新发现的问题,称它“拍摄了我们太阳系外行星的第一张照片”。然而天文学家们指出,第一张系外行星照片是由欧洲南方天文台的甚大望远镜(VLT)在2004年拍摄的。

天文学家们认为,这一问题可能源于人工智能误解了“模棱两可的NASA新闻稿,低估了过去的历史”。

这个故障凸显了Bard等所谓的生成人工智能系统的一个常见缺陷:这些系统不能“理解”它们反刍的信息,只能根据概率进行猜测。而微软也承认了它的聊天机器人也面临类似的挑战。

尽管语言模型可以生成连贯且语法正确的文本,但它们也会表达虚假信息。

离奇的是,上述错误通过了谷歌的各个工程、法律、公关和营销部门,并在出现在了Bard最重要的演示中。

Bard的“出师不利”,无疑对本就急需这一战“扳回一城”的谷歌造成打击。周三,谷歌一度跌去近10%市值,损失高达1200亿美元。

除此之外,谷歌的利润下降可能也在所难免。去年四季度,谷歌营收和EPS均逊于预期,连续第三个季度盈利同比下滑,广告收入下降了4%,是其历史上第二个季度萎缩。

行动太仓促

Bard出现重大错误,可能反映出谷歌为了应对微软,在推行这一项目时过于匆忙。

有媒体指出,ChatGPT在去年推出时,也被人们发现了会提供错误信息。尽管OpenAI没有提供错误信息频率的统计数据,但这家公司表示,会通过定期更新使该工具变得更好。

相比之下,谷歌似乎在使用这项新技术方面更加大胆。

在微软发布的必应的例子中,聊天机器人的答案将被降级到页面的一侧,而不是通常搜索结果将保留的前面和中心。机器人的回答还包括脚注和来源材料的链接,这在ChatGPT当中是没有的,但这使得微软的工具看起来更值得信赖。

反观谷歌的Bard,回答放在页面中间、搜索结果上方显示了单一的摘要答案,并且没有脚注,这意味着用户不可能识别来源。

这也许是因为谷歌面临着迅速行动的压力。

OpenAI等公司试图通过增加数十亿个参数来提高语言模型的准确性,但一些研究人员怀疑,随着模型的增长,准确性的回报会递减。

对微软和谷歌来说,消除这些持续存在的少数谎言可能成为一项长期挑战。

本文来自华尔街见闻,欢迎下载APP查看更多

由于人工智能的失误,谷歌市值一夜之间蒸发了7172亿

谷歌2月8日晚美股开盘大跌7%,市值直接蒸发1020亿美元,约合人民币接近7000亿元,而这个跌幅主要原因是谷歌的人工智能聊天机器人Bard在一场发布会上演示用户提问结果给出了错误的答案。

该问题为“关于詹姆斯·韦伯太空望远镜(JWST),我可以告诉我9岁的孩子它有哪些新发现?”对此,Bard给出了很多答案,其中一个包括,太阳系外行星的第一张照片,是用JWST拍摄的。而实际上,早在2004年欧洲南方天文台的甚大望远镜(VLT),就拍摄了第一张系外行星照片。

所以这个答案是错误,这让不少人对这个聊天机器人Bard的能力产生了质疑。

而要知道市场上是将聊天机器人Bard看成谷歌与ChatGPT竞争的主要手段,此次错误答案一出,对于市场来说也丧失了信心。

(8116949)

令人尴尬的谷歌AI聊天机器人答错问题,股价下跌7.4%,市值蒸发近7000亿

每经编辑:张锦河

2月8日晚美股开盘,美股三大指数集体低开,道指跌0.29%,纳指跌0.37%,标普500指数跌0.40%。

谷歌大跌超7%,市值蒸发约1020亿美元(约6932.50亿元人民币)。此前谷歌人工智能聊天机器人Bard在一场发布会上对用户提出的问题给出错误回答。

谷歌聊天机器人Bard答错问题

2月7日,谷歌通过Twitter发布了一个在线短视频广告,推广其旗下Bard。Bard是近日爆火刷屏、给谷歌搜索带来巨大威胁的ChatGPT的竞品。然而,万众瞩目、备受期待的Bard,却出师不利。

谷歌在广告中表示,Bard是一项实验性对话式AI服务,由LaMDA提供支持。Bard使用谷歌的大型语言模型构建,并利用网络信息。谷歌将其聊天机器人描述为“好奇心的发射台”,称它有助于简化复杂的话题。目前,谷歌的这一广告在Twitter上的浏览量已达到100万次。

这家科技巨头在Twitter上发布了一段巴德行动的GIF视频,称这款聊天机器人是“好奇心的发射台”,有助于简化复杂的话题。

有提问问道,“关于詹姆斯·韦伯太空望远镜(JWST),我可以告诉我9岁的孩子它有哪些新发现?”对此,Bard给出了很多答案,其中一个包括,太阳系外行星的第一张照片,是用JWST拍摄的。然而,这个答案是不准确的。根据美国国家航空航天局(NASA),2004年,欧洲南方天文台的甚大望远镜(VLT),拍摄了第一张系外行星照片。

谷歌的新人工智能工具Bard犯了事实性错误,这加剧了人们对相关工具尚未准备好集成到搜索引擎中的担忧。

据《金融时报》报道,谷歌2月6日透露计划推出一款聊天机器人Bard,与OpenAI颇受欢迎的ChatGPT竞争。该公司正寻求在将强大的新语言人工智能引入互联网搜索业务的竞赛中收复失地。

图片来源:每日经济新闻 刘国梅 摄

模型对抗

Bard由谷歌对话应用语言模型LaMDA驱动。实际上,这一底层技术已经存在了一段时间,早在2021年,谷歌就已开始进行由LaMDA支持的对话型AI服务开发,但并未广泛为公众所用。

谷歌所研发的LaMDA,是一种基于网络上数十亿词汇进行训练的大型语言模型。它不仅受益于谷歌更强大的计算能力和研发团队,并且谷歌还有能力通过数百万用户的反馈来对LaMDA模型及聊天机器人Bard进行微调。

2022年年底,LaMDA曾一度登上媒体头条。当时,谷歌AI研究员布莱克•雷蒙恩(Blake Lemoine)坚信,LaMDA是“有意识、有灵魂”的,但他的说法在受到广泛批评,最终谷歌驳回他的说法,并让其带薪休假。

实际上,谷歌是最先提出深度学习模型核心算法的企业,其对大语言模型的研究很早就开始了,2018年BERT横空出世。2021年,谷歌又推出了比BERT更强大的MUM。

马萨诸塞大学洛厄尔分校计算机科学教授Jie Wang在此前接受《每日经济新闻》采访时表示,像谷歌这样的大公司会有一定优势,因为他们拥有人力、技术和财力资源。不过,没有一个模型可以在所有方面都擅长。因此,所有公司在市场上有足够的空间。这将是一场新的比赛,尤其是在深度和正确性方面。

ChatGPT的背后,是OpenAI一手打造的GPT-3.5模型。可以说,Bard和ChatGPT的对决,就是LaMDA和GPT-3.5的对决,也是谷歌和OpenAI这两个在大语言模型领域冠绝全球的双雄之间的主战场。媒体评论称,基于LaMDA的聊天机器人Bard将成为谷歌此次的决胜关键。

每日经济新闻综合自公开资料

每日经济新闻