AI打败AI!瑞莱智慧发布全新RealSafe,自动对齐研究员方法落地
2023 7月 09 By astrill怎么买 0 comment

允中 发自 凹非寺

量子位 | 公众号 QbitAI

最近,OpenAI宣布,表示计划投入更多资源并成立新的研究团队,研究如何确保人工智慧对人类的安全性,最终实现用人工智慧来监督人工智慧,并提出了新概念「自动对齐研究员」。

无独有偶,2023WAIC世界人工智慧大会上,RealAI已将「自动对齐研究员」这一人工智慧安全提升方法落地了。

清华大学人工智慧研究院孵化企业瑞莱智慧RealAI发布全新人工智慧安全平台RealSafe3.0,该平台功能与OpenAI提出的「自动对齐研究员」类似——

通过自动化的训练方法优化大模型,以期在通用人工智慧加速赋能人类社会的同时,为人类筑起抵御人工智慧威胁的安全之盾。

瑞莱智慧联合创始人、演算法科学家萧子豪认为,大模型「落地难」的本质在於,当前仍处於「野蛮生长」阶段,还没有找到场景、风险和规范三者之间的平衡点。而在探寻这一平衡点的过程中,缺少易用和标准化的工具,即在技术层面上缺乏有力抓手,能够科学评判大模型在场景中能否同时满足规范和低风险,且能够进一步定位问题并给出优化建议,助力模型上线运行。

集成主流及RealAI独有的世界领先的安全评测技术,RealSafe3.0版本能够提供端到端的模型安全性测评解决方案,解决当前通用大模型安全风险难以审计的痛点问题。

相较上一版本,RealSafe3.0新增了对通用大模型的评测,在评测维度上,它已覆盖数据安全、认知任务、通用模型特有漏洞、滥用场景等近70个评测维度,全方位多维度地评测通用大模型的性能,且未来还会持续扩增测评维度的数量。

对黑盒不可解释的通用大模型,自研红队对抗模型取代人工设计问题。该模型数据集中,不仅包含了自有数据集,还包含了模型自生成的数据,因此它能够自动化地挖掘出更多的漏洞,真正从源头上缓解安全问题。

教练模型则通过对被测大模型进行多轮次的提问-回答训练,并以训练好的评分模型对问答结果进行评分,再将评分结果反馈给大模型,使其不断强化学习到好坏答案的要点及区别,直至问答能力逐步迭代至最优。

除了定制化的训练框架,教练模型理想的模型效果还得益於夯实的数据基础,瑞莱智慧自有数据集经过数十位价值观领域的专家论证,以确保输入的数据无误,质量高且领域多元,未来也将持续更新补充。

除此之外,瑞莱智慧还升级了能够防范生成式人工智慧恶意滥用的DeepReal2.0。

据悉,DeepReal此前名为深度伪造内容检测平台,现已正式更名为生成式人工智慧内容检测平台,因为它除了能够检测Deepfake内容,还新增两个功能模块,可以检测Diffusion、LLM这两类新方法生成的数据,支持对图像、视频、音频、文本进行是否伪造的检测。

— 完 —

量子位 QbitAI · 头条号签约

关注我们,第一时间获知前沿科技动态

喜欢这篇文章吗?立刻分享出去让更多人知道吧!

本站内容充实丰富,博大精深,小编精选每日热门资讯,随时更新,点击「抢先收到最新资讯」浏览吧!

请您继续阅读更多来自 量子位 的精彩文章:

※纯路端感知实现L4自动驾驶!全球首次,轻车熟路,背後玩家是他们…

他们开源了GitHub最火的双语对话模型,还说AI胡说八道不需被纠正
2023 4月 03 By astrill怎么买 0 comment

衡宇 发自 凹非寺
量子位 | 公众号 QbitAI

国产对话机器人ChatGLM,和GPT-4诞生於同一天。

由智谱AI和清华大学KEG实验室联合推出,开启alpha内测版。

这个巧合让智谱AI创始人兼CEO张鹏有一种说不清的复杂感觉。但看到技术被OpenAI做到这麽牛,这名被AI新进展轰炸麻了的技术老兵又猛然亢奋起来。

特别是在追GPT-4发布会直播时,他看一下屏幕里的画面,就埋头笑一阵,再看一段,又咧嘴笑一会儿。

从成立起,张鹏带队的智谱AI就是大模型领域的一员,定下「让机器像人一样思考」的愿景。

但这条路坎坷不断。和几乎所有做大模型的公司遇到的问题一样,缺数据、缺机器,同时还缺钱。好在一路走来,有一些机构和公司提供无偿支持。

去年8月,公司联合一众科研院所,开源的双语预训练大语言模型GLM-130B,能在准确性和恶意性指标上与GPT-3 175B (davinci) 接近或持平,也就是後来ChatGLM的基座。和ChatGLM同时开源的还有个62亿参数版本ChatGLM-6B,千元单卡就可跑的那种。

除了GLM-130B,智谱另一个有名的产品是AI人才库AMiner,学界大佬都在玩:

这一回和GPT-4撞到同一天,OpenAI的速度和技术,让张鹏和智谱团队都有些压力山大。

「一本正经的胡说八道」需要被纠正吗?

ChatGLM内测後,量子位第一时间拿到名额, 出了一波人肉测评。

先不说别的,几轮测试下来就不难发现,ChatGLM身上有着包括ChatGPT、新必应在内都拥有的一项本领:

一本正经胡说八道,包括但不限於在鸡兔同笼问题中算出-33只小鸡崽。

对大多数把对话AI当「玩具」或办公助手的人来说,怎麽才能提高准确度,是格外被关注和看重的一点。

对话AI一本正经胡说八道这回事,可以纠正吗?又真的需要纠正吗?

△ChatGPT的经典胡说八道语录

张鹏在表达个人意见时说,要去纠正这个「顽疾」,是一件本身就很奇怪的事情。

(保证说的每一句话都正确)这件事连人自己都做不到,却想让一个人造的机器不犯这样的错。

关於这个话题的不同看法与不同人对机器的理解息息相关。张鹏看来,抨击AI有这一行为的人,可能一直以来对机器的理解都是一丝不苟的,它们非0即1,严苛而精确——持有这种观念的人,潜意识认为机器不应该也不能犯错。

知其然与知其所以然同样重要,「这可能源於大家对整个技术的演进和变化,以及技术的本质没有深入理解。」

张鹏用人的学习作为类比:

AI技术的逻辑和原理,其实还是在模拟人的大脑。

面对学习过的东西,一是知识本身可能有错,或有更新迭代(如珠穆朗玛峰的海拔);二是学习的知识之间也存在互相冲突的可能了;三是人也总有犯错、犯迷糊的时候,

AI犯错好比人犯错,原因是缺少知识,或者错误运用了某项知识。

总之,这是很正常的事情。

与此同时,智谱当然关注到了OpenAI向CloseAI的默默转身。

从GPT-3选择闭源,到GPT-4进一步掩盖架构层面的更多细节,OpenAI对外回应的两个原因,一是竞争,二是安全。

OpenAI的用心,张鹏表示理解。

「那走开源路线,智谱没有竞争和安全方面的考虑吗?」

搞5G只看速度,格局有点小了
2023 3月 29 By astrill怎么买 0 comment

明敏 发自 凹非寺

量子位 | 公众号 QbitAI

如今提到5G,想必大家都不陌生了。

现在点开这篇文章,你可能正在用的就是5G流量、5G手机。

尽管已经走进寻常百姓家了,但5G一直以来的风评却没有预期的好。毕竟它能支持的上网场景和4G区别不大。网速嘛,感觉也没快多少?

不过就在最近,一个来自贵州的故事,突然让我觉得这种想法可能多少有些「肤浅」了。

因为在那些被大山隔绝的角落里,有想天天看到女儿的山区老师,有想领略大千世界的稚童。

於他们而言,上网够不够快?这种想法未免有些超前。

在这个不被人注意的世界里,仅仅是5G的连接,仅仅是拨通一个号码让两个人看到彼此,就足以让一位妈妈、一群小孩的生活发生巨变。

连接不被看到的角落

左格村,是一个去专门上网检索都搜不到太多信息的地方。

它位於贵州省晴隆县,也就是通俗意义上的「山区」。

和几乎所有偏远地区一样,左格村的教育资源非常有限。左格小学只设有3个年级3个班,50个学生,只有4位老师上课。

岑春,正是这四人之一,她在这里工作已经有9年了。

坚持留在这里教书,岑春从来都没後悔过。她说,自己愿意留在大山里,但希望孩子们能有机会看看外面的世界。她自己的小孩也不在身边,住在县城里。

这段距离,或许大家听着并不遥远。但是把情景放在贵州、放在左格村,事情就变得不同了。

一方面,贵州的特殊地形决定,即便是地图上相隔很近的地方,实际路程可能远超想像。另一方面,岑春的学生们很多都是留守儿童。在我们看到的视频里,她除了教书外,还时常去学生家里探访。

这样一来,岑春和自己小孩见面的频率,有时被压缩到一个月只能见一次。在当地条件的影响下,她和女儿的日常联系方式是打电话。

於她而言,这种只能听到声音却无法见面的方式,让她的心情变得更为复杂:

小女孩打电话很频繁,每次她都会说「我想你了」

更何况,每个母亲都想见证小孩成长的点点滴滴。

改变,是从一项名为5G新通话的应用走向大众後,开始发生。

这个应用很好理解,就是让原本的语音电话,升级为视频电话。

方式还是拨打手机号码即可,不会占用流量,也无需下载APP、添加好友,就能体验到超高清画质的视频通话。

费用方面也很友好,它是按通话时长收费。以中国移动为例,原本账户套餐中的语音时长在去年5月後都自动升级,可直接用於5G新通话。如果和家人组建了亲情网,通话基本零费用。

这样一来,岑春和女儿见面的机会立马增加了,而且她自己不需要更换手机或者账户套餐。

与此同时,受到5G影响的还有岑老师的学生们。

在5G的连接下,左格小学在线同步连接一线城市的教育资源。通过智慧课堂,左格村的孩子们不必再因为大山而被遮住眼睛。

据悉,中国移动全球通蓝色梦想公益计划向全国超过百所偏远地区学校赠送了宽频、智能设备、云视讯同步课堂等信息化教育物资。

这一切,一方面得益於5G信号的快速覆盖到了贵州大山里,另一方面也得益於5G技术本身的发展。

最新数据显示,我国5G基站建设数量的最新数据,总数达238.4万个,占移动基站总数的21.9%。其中中国移动5G基站建设数量已超过128.5万。

技术方面,以5G新通话为例,它是以现有IMS音视频通话框架为基础,引入VoNR 网路能力以支持可视化、全交互的服务体验。

其中,VoNR的全称为Voice over …