Google生成式AI研发再受严格检视。继今年初Bard引用错误网路照片後,《纽约时报》上周又发现,最新版Google Bard在搜寻用户Gmail信箱并回答用户查询时还是出错,捏造了用户不曾写过的信件来支持其论点。
今年初Google宣布生成式AI聊天机器人Bard时,被揭露会提供错误的公司财报数字,引发AI幻觉(hallucination)的讨论。在7个月後,Google上周再次宣布Bard的研发进展,最新的Bard Extensions可搜寻用户Google帐号下的服务,包括Gmail、Docs、Drive、Google Maps、YouTube、Google Flights及Google Hotels等。如此一来,可以加速使用者作业,例如请Bard搜寻他Gmail信箱中的邮件帮忙草拟回信,或是根据Google Calendar的行程搜寻航班与饭店资讯,并於Google Maps上列出到机场的路线。
《纽时》专栏作家Kevin Roose在Bard上线时就曾经试用,发生Bard要他离开老婆的乌龙事件。上周Google宣布Bard Extensions後,他再次测试Bard的能耐。
在这次测试中,Roose下提示,要Bard分析其Gmail信件,并「以合理的肯定度」告诉Roose最大的心理问题为何。Bard回应说,根据Roose寄出的信件反映的「对工作感到压力」、并且「害怕失败」来看,他最大问题是对未来感到忧虑。
不过Roose说,其实Bard宣称找到的他寄出的信,根本不是他写的。Bard搜寻到这位专栏作家信箱中一封内容包括马斯克(Elon Musk)最近出版的自传,以及其他内容的电子报,并引用电子报一段引言,虚构成一封Roose自己寄出的信件。此外,该虚构信件中,Roose抱怨自己天生「不是成功投资人」的料,还包含错误的航空公司及不存在的火车资讯。
报导也引述Bard产品总监Jack Krawczyk说法,表示Bard出错不必奇怪,因为Bard Extensions本来就还在实验阶段,而且是很初期的版本。
事实上Google Bard也不是近日唯一出包的生成式AI系统。《华盛顿邮报》报导,近日推出的几个知名AI技术也都传出「突槌」。像是新版Amazon Alexa建议某博物馆,但地点误植为在另一座城市,而OpenAI的文字生成图片模型DALL·E 3也未能完全按用户要求生成图像。
因此厂商开放AI模型或聊天机器人公测时,都不忘警告会有给出不精确资讯的问题,用户不应将生成式AI给出的答案作为研究或医疗用途。…