2023 3月 27 By astrill怎么买 0 comment

为了开发出能优先考虑透明度、问责制(Accountability)、人类代理监督及使用者利益的 AI 人工智慧,火狐(Firefox)浏览器开发商 Mozilla 於 22 日成立一家聚焦在「可信赖 AI」(Trustworthy AI )的新创公司 Mozilla.ai。 

去年 11 月 ChatGPT 问世,引发全球跟风热潮,举凡微软、Google、DuckDuckGo、Grammarly 及 Adobe 等公司莫不纷纷推出自家生成式 AI 工具。但当前生成式 AI 服务最令人诟病的地方,莫过於这些服务通常会将内含错误及不实的资讯包装成听起来很权威的叙述,而且他们对於所运用资讯的正确与否并不了解。

为了扭转这个现象,Mozilla 宣称秉持着可信赖 AI 理念,成立与这股风潮反其道而行的 Mozilla.ai 新创公司,致力打造一个独立、去中心化、可信赖,同时让可信赖产品开发更加容易的 AI 生态系统。基本上,Mozilla.ai 一开始就会将关注的焦点放在会让生成式 AI 服务更安全、更透明的工具,以及不会误导使用者的推荐系统上。

目前,Mozilla 已在 Mozilla.ai 身上初步投资了 3,000 万美元,整个公司将由三人事会主导,并由华为诺亚方舟实验室前首席科学家 …

2023 3月 16 By astrill怎么买 0 comment

Open AI 释出最新一代 ChatGPT-4,新增图像辨识功能,更新速度一日千里,外界预期将延续先前从 ChatGPT-3.5 带来的热潮。自 Open AI 在去年 11 月 30 日正式让 ChatGPT 对外公开提供服务後,因为支援中文使用,几乎是在农历春节假期结束过後开始引发台湾民众的讨论热度,而透过 Google Trends 回顾,2 月可以看见 ChatGPT 此一关键字热度持续攀升,到 2 月 23 日达到巅峰,而至 3 月中旬前後,也仍维持在相当高的热门程度。

AI研发跃跃欲试,供应链未来两季受惠程度高

如果观察与ChatGPT相关的关键字与相关主题,其概念股与使用方式受到的瞩目程度最高,但要回答哪些产业与股票会受到ChatGPT与生成式AI趋势带动,依IDC资深研究经理蔡宜秀的判断来看,无庸置疑投资ChatGPT背後团队Open AI的微软(Microsoft)最受惠,而硬体上让AI能够拥有相当人脑运算能力的晶片厂商,且在AI领域遥遥领先的NVIDIA也不应错过,蔡宜秀指出,NVIDIA已经对客户开放生成式AI的云端解决方案,可以想见在第二季、第三季会有许多产业对生成式AI有好奇心进而投入研发与测试,国内NVIDIA供应链也会同步受惠。譬如高速运算(HPC)晶片代工领域的龙头台积电会受惠是想当然尔的,IC设计厂商也不会缺席,而间接受惠的族群还有伺服器、散热。

(Source:MoneyDJ整理)

大型语言模型仍是科技大厂相互竞逐的进行式

那下一个生成式AI的热潮会在哪里?要回答这个问题,则需要回到生成式AI与AI领域来解答,为什麽ChatGPT受到瞩目程度如此高?又为什麽ChatGPT的使用经验让人对AI技术惊艳?AI的概念并不新颖,至少可能没有像元宇宙那麽新,生成式AI也并非横空出世的新服务,而是透过大型语言模型(Large Language Model)达成自然语言处理(Natural Language Processing),令使用者拥有彷佛与人对答的体验。

大型语言模型的开发无疑将成为生成式AI的决胜关键,前一次对垒微软但以失败收场的Google,过去所拥有的BERT其实比ChatGPT更早打开知名度,并且应用在改良搜寻结果的技术上,微软在此场AI竞赛中其实是後发先至,但两者的竞赛带出一个重要的关键,在於开发大型语言模型这件事上,科技大厂拥有绝对的优势,关乎资料量、训练时间跟硬体支出,尖牙股Meta、Amazon等在这个议题上全都摩拳擦掌,现在就说ChatGPT将赢者全拿,是言之过早。

▲ 查询苍蝇头食谱。(Source:ChatGPT)…

2023 3月 01 By astrill怎么续费 0 comment

聊天机器人 ChatGPT 掀起人工智慧生成内容(AIGC)热潮,带动晶片运算力需求,小晶片(Chiplet)技术可提升 AI 晶片效能,也成为中国厂商布局 AIGC 晶片先进制程、加速升级运算能力的突破口。

聊天机器人ChatGPT掀起人工智慧生成内容(AIGC)热潮,也带动人工智慧(AI)晶片、绘图处理器(GPU)甚至通用绘图处理器(GPGPU)、中央处理器(CPU)、特殊应用晶片(ASIC)、可编程连逻辑闸阵列(FPGA)等性能和需求。

亚系外资法人指出,虽然AI晶片、GPU、CPU、FPGA等晶片已对AIGC底层架构提供运算力,但AIGC应用未来所需运算能力将大幅增加,采用小晶片(Chiplet)异质整合架构设计,以及高阶封装技术,可提升AI晶片运算功能。

小晶片技术被半导体业界视为超越摩尔定律物理极限的关键技术,小晶片技术透过同质整合(homogeneous Integration)和异质整合(heterogeneous Integration),把多颗处理器引擎、记忆体、射频元件、电源管理晶片、光学元件、声学元件、感测元件等整合在一颗小晶片的晶片网路。而小晶片技术得以发挥的关键,在於先进封装。

半导体大厂正积极布局小晶片相关高阶封装技术,例如封测大厂日月光半导体布局扇出型基板晶片封装技术(FOCoS),将多个独立晶片整合在一个扇出型封装中。此外美商超微(AMD)与晶圆代工大厂台积电合作开发3D小晶片技术,相关运算产品已在2021年底生产。

美系外资法人分析,台积电的2.5D CoWoS封装和小晶片技术,以及3D Fabric先进封装技术,结合自身的7奈米及5奈米先进制程,可因应高效能运算晶片大厂订单。

资策会产业情报研究所(MIC)指出,英特尔(Intel)与台积电三星(Samsung)、超微(AMD)、微软(Microsoft)、Google、日月光等大厂邀请各界共同推动的UCIe小晶片(Chiplet)联盟,有助小晶片Chiplet资料传输架构标准化,降低小晶片先进封装设计成本,UCIe成为未来高阶运算晶片开发主推的小晶片整合技术平台。

中国也正亟思搭上AIGC应用热潮,如何突破美国晶片禁令「弯道超车」,掌握小晶片技术已成为中国厂商布局AIGC晶片先进制程、加速升级运算能力的突破口。

在伺服器晶片领域,中国厂商正在采用小晶片技术提升运算效能,例如华为旗下海思、寒武纪科技采用7奈米制程的伺服器晶片和AI晶片,已采用小晶片技术。

在半导体封装,江苏长电和通富微电等中国厂商也积极布局小晶片技术,通富微电持续与美系处理器晶片大厂超微维持策略合作夥伴关系。

(作者:锺荣峰;首图来源:shutterstock)

2023 2月 24 By astrill怎么买 0 comment

首个开源 ChatGPT 低成本再现流程来了!预训练、奖励模型训练、强化学习训练,一次性打通。

明敏发自凹非寺,量子位 | 公众号QbitAI

最小demo训练流程仅需1.62GB显卡记忆体,随便一张消费级显卡就能满足。单卡模型容量最多提升10.3倍,相比原生PyTorch,单机训练速度最高可提升7.73倍,单卡推理速度提升1.42倍,仅需一行代码。

微调任务可最多提升单卡微调模型容量3.7倍,同时保持高速运行,同样仅需一行代码。ChatGPT红是红,再现也真的难,毕竟ChatGPT不开源,市面至今没有开源预训练权重、完全开源的低成本训练流程,且千亿等级大模型训练本身就是难题。

但ChatGPT军备赛已愈演愈烈,为了抓住趋势,如Google等都在打造竞品。快速再现ChatGPT是应趋势所需,开源加速方案Colossal-AI正是为此而来,且提供开源完整再现流程同时,也降低成本。

降低显卡记忆体消耗是关键

ChatGPT效果好,主要是训练过程引入人类回馈强化学习(RLHF),但也直接导致ChatGPT再现训练难度飙升。流程分为三阶段:

1. 监督微调:从Prompt库采样,收集人工回答,利用这些数据微调预训练大语言模型。

2. 奖励模型:从Prompt库采样,使用大语言模型产生多个回答,人工排序回答後,训练奖励模型(RM)模拟人类价值判断。

3. 基於第一阶段的监督微调模型和第二阶段奖励模型,利用强化学习演算法训练大语言模型。

▲ RLHF三个阶段。

对ChatGPT训练而言,第三阶段是核心部分。OpenAI采用强化学习近端策略最佳化演算法(PPO),引入奖励讯号,使语言模型产生内容更符合人类评判标准。但引入强化学习,代表有更多模型调用。如使用基於Actor-Critic(AC)结构的PPO演算法,需训练时进行Actor、Critic两个模型前向推理和反向传播,以及监督微调模型、奖励模型多次前向推理。

ChatGPT基础的InstructGPT论文,Actor和监督微调模型都使用1,750亿参数GPT-3系列模型,Critic和奖励模型使用60亿参数GPT-3系列模型。大规模模型参数,代表想启动原始ChatGPT训练流程,需要数千GB显卡记忆体,单张GPU显然无法容纳,常见数据并行技术也不能搞定。

即便引入张量并行、流水并行划分参数,也需要至少64张80GB的A100为硬体基础,且流水并行并不适合AIGC产生任务,bubble和调度复杂会导致效率受限。

单张消费级显卡都能体验

Colossal-AI基於ZeRO、Gemini、LoRA、Chunk-based记忆体管理等方法,提出一系列单卡、单机多卡、大规模并行解决方案。对基於GPT-3系列模型的ChatGPT,Colossal-AI能用原本一半硬体资源启动1,750亿参数模型训练,从64卡降低到32卡。如果续用64卡,则将训练时间压缩到更短,节省训练成本、加速产品更新。

为了让更多开发者体验再现ChatGPT,除了1750亿参数版本,Colossal-AI还提供单卡、单机4 / 8卡类ChatGPT版本,以降低硬体限制。

单机多卡服务器,即便显卡规格提升为A100 80GB,由於ChatGPT复杂性和内存碎片,PyTorch最大也只能启动基於GPT-L(774M)这类小模型ChatGPT。用PyTorch原生DistributedDataParallel(DDP)进行多卡并行扩展至4卡或8卡,性能提升有限。Colossal-AI最高可提升单机训练速度7.73倍,单卡推理速度1.42倍,还可继续扩大规模并行。

为了尽可能降低训练成本和上手门槛,Colossal-AI还提供单张GPU即可尝试的ChatGPT训练流程。相比PyTorch在约10万元的A100 80GB最大仅能启动7.8亿参数模型,Colossal-AI将单卡容量提升10.3倍至80亿参数。对於基於1.2亿参数小模型的ChatGPT训练,最低仅需1.62GB显卡记忆体,任意单张消费级GPU即可满足。

此外,Colossal-AI也致力降低基於预训练大模型的微调任务成本。以ChatGPT可选的开源基础模型OPT为例,相比PyTorch,Colossal-AI可提升单卡微调模型容量3.7倍(原始计算量显着增大),同时保持高速运行。

一行代码快速上手

操作部分,如再现流程多步骤,基於Colossal-AI开源方案,都能一行代码快速上手。先看模型部分。尽管ChatGPT背後大语言模型GPT-3.5不开源,但GPT、OPT、BLOOM等主流开源模型都可取代。

Colossal-AI为Hugging Face社群这些模型提供开箱即用的ChatGPT再现代码,涵盖三阶段训练。以GPT为例,加一行代码指定使用Colossal-AI为系统策略即可快速启用。

使用下列指令即可快速启动单卡、单机多卡、1750亿版训练,并测试各种性能指标(包括最大记忆体占用、吞吐率和TFLOPS等):

背後原理如何?

核心方案还是Colossal-AI。毕竟诞生起就是大模型应用专用,可基於PyTorch高效快速部署AI大模型训练和推理,是这领域的明星,GitHub Star超过8千,并成功入选SC、AAAI、PPoPP、CVPR等国际AI与HPC顶级会议的官方教程。…

2023 2月 23 By astrill怎么续费 0 comment

美国知名线上科幻杂志《克拉克世界》22  日宣布暂停接受投稿,因为由人工智慧(AI)产制的稿件泛滥成灾,令编辑团队不堪负荷,光是 2 月就拒绝多达 500 份投稿。

英国卫报(The Guardian)报导,《克拉克世界》(Clarkesworld)杂志曾刊登过范德麦尔(Jeff VanderMeer)、李允夏(Yoon Ha Lee,音译)及瓦伦特(Catherynne Valente)等知名作家作品,也是少数接受新秀作家公开投稿短篇小说并支付稿费的出版业者之一。

不过,根据创始编辑克拉克(Neil Clarke)的说法,这项承诺吸引了网红的注意并提倡利用AI「快速致富」的方法。

克拉克在一篇部落格文章中表示,杂志每个月约莫会接到10篇被认定为抄袭他人作品的投稿,但聊天机器人ChatGPT自去年推出以来,将AI语言模型推升至主流地位,投稿拒绝率开始飙升。

克拉克说,1月分他们就拒绝了100份投稿,并禁止这些「作家」再次投稿。2月以来,他拒绝的稿件已超过500份。

他在文中提到:「我已经和几位编辑取得联系,我遇到的情况绝对不是特例……这种情况似乎确实正在冲击较高规格且『永远开放』的市场,比起设有投稿门槛或稿费较低的管道更严重。」

克拉克还说:「原本的方法显然已行不通,我担心这种做法会对国际新秀作家造成更多的阻碍,短篇小说需要这些人。这问题不会突然间自行消失,我也没办法解决。」

关闭投稿管道是个激烈之举,但在确认解决方案之前,「克拉克世界」暂不考虑作家们的故事。

(译者:张茗喧;首图来源:Unsplash)…

2023 2月 12 By 超级小子DIY 0 comment

随着 AI 大战越演越烈,Google 搜寻引擎负责人 11 日在采访中警告,要防止 AI 在聊天机器人中造成的隐患。

Google 资深副总裁兼 Google 搜寻负责人 Prabhakar Raghavan 告诉德媒《世界报》(Welt am Sonntag ),「我们现在谈论的这种 AI,有时导致我们称之为『幻觉』的东西,然後,机器会以一种令人信服但完全虚构的答案,来表达自己」。他补充,基本任务是将这种情况降至最低。

微软以约 100 亿美元支持新创公司 OpenAI 的 ChatGPT,後者在一推出时便造成轰动,因为 ChatGPT 能给出非常人性化的回覆,让许多网友相当惊讶,自此之後,Google 一直处於不利状态。

Alphabet 旗下 Google 本周宣布推出 AI 聊天机器人「Bard」,但回答问题失误,导致周三股价暴跌近 8%,市值损失 1,000 亿美元。目前 Alphabet 仍在对 Bard …

2023 2月 10 By 超级小子DIY 0 comment

微软将整合 ChatGPT 与 Bing 推出新搜寻功能,此举竟有可能挑战 Google 长年垄断的地位?《科技新报》取得「生活中的程式」粉专的文章授权转载,一起来看他的见解。

微软(Microsoft)将整合ChatGPT与Bing推出新搜寻功能,预计3月底前发布,而未来Bing整合ChatGPT後最大的差别就是收益来源,这可能会让科技巨头在未来3~5年大洗牌。

Google搜寻时使用者会探索网页,这时会产生大量置入广告的机会,也就是常听到的「关键字广告」。而未来Bing的更新可能改写使用网路搜寻行为、体验和搜寻服务,并有机会挑战Google长年垄断的地位。

根据StatCounter做的统计:目前市占率Google 92.18%、Bing 3.03%。可以发现Bing目前就是被Google压在地上打啊!

然後Bing搜寻次数最多的关键字还是「Google」,代表使用Bing的很多还只是因为Bing是Windows的预设搜寻引擎。

但导入ChatGPT後的搜寻可能让使用者的足迹瞬间减少到只剩搜寻页面,能下的广告页面可能只剩下少少的The more推荐,所以Google的传统商业模式难以整套复制到AI搜寻服务。

可以想像一下:当你请ChatGPT推荐几间饭店,你会直接去ChatGPT推荐的,还是去下面The more推荐的?又如果ChatGPT回答的答案就是广告赞助商,那对搜寻引擎自身来说就是慢性自杀。

这对 Google 的影响有多大呢?

Google 2022的总营收为680亿美元、其中广告营收为547亿美元,而源自於搜寻的广告营收就有396亿美元,占总营收的58%或广告营收的72%。

可以说是Google搜寻当乾爹养起了大家常用的Gmail、Google云端、Google Meet等免费服务。

这也是Google过去推过LaMDA聊天机器人,却没有积极发展为AI搜寻服务的原因,当搜寻引擎市场的商业模式被改变,Google独占的竞争地位和收益都可能不保,也是直到ChatGPT後Google才紧急在LaMDA基础上打造Bard,并准备开放让大众使用。

这代表其实Google一直以来就有在开发类似产品,但因为有可能反过来伤害到自己本业而迟迟未推出。

AI对话实际的应用与限制,有兴趣可以玩玩笔者用 LINE 串接的 OpenAI 的语言模型。

这模型用的是Davinci003,而基本上Bing未来要整并的是Prometheus,可以看做是下下世代的版本。(Davinci003→ChatGPT→Prometheus)

Prometheus基本上会解决ChatGPT的几个问题:

  1. 无法问他近期即时的资料,诸如天气、新闻等等。
  2. 安全回答法:问他医疗相关,大概率会回答「请谘询医师」。
  3. 无法放上参考资料来源,因为回答的本身就是生成出来的。
  4. 无法区分现实与幻想:问景点结果跟你瞎掰。

但实际使用ChatGPT後,个人认为Google搜寻的地位还是很难被挑战,因为Google提供的是难以取代的第一手网路来源。

除了收益来源外,两种搜寻方式主要会有以下几种差异:

1.

2023 2月 07 By 超级小子DIY 0 comment

全球金融市场今年来再度以超乎预期的表现,带给投资人对於全年行情的乐观期待,第一金投信指出,年初至今全球股市表现,像是复制 2021 年的多头走势,科技股全面演出修复行情,最值得留意的亮点是 AI 人工智慧与机器人自动化等新技术运用,带动海外股票型基金前三绩效狂飙 20%。

第一金投信表示,这也呼应 ARK 投资元月底最新发布的《BIG IDEAS 2023》,点名人工智慧、公众区块錬、基因多体定序、能源储存、机器人自动化等五大领域将引领未来科技时代,其中人工智慧更是今年最重要的成长催化剂。

根据 Bloomberg 资料统计,这波强势上攻的指数包括费城半导体指数、标普 500 指数类股表现如通讯服务产业、资讯科技,以及 Robo Global AI 人工智慧、机器人自动化等产业指数,涨幅皆在两成上下。

统计数据指出,2021 年全球金融市场一涨成名的方舟系列基金,今年以来也有多档基金再度飙出三至四成的涨幅,而这波涨幅最大的亮点,还有降价求售的电动车龙头 Tesla,从年初股价低档反弹以来涨幅更已突破七成。

第一金全球 AI 人工智慧基金经理人李坤宪指出,元月份在美国举行的 CES 消费电子大展,出现更多 AI 赋能的产品,例如 AI 烤箱、智能冰箱、自驾婴儿车等,而人工智慧 ChatGPT 更是爆红,让 AI主 题有个亮眼的开局,引领半导体、自动化、电动车等股价狂飙。

李坤宪说明,未来生成式 AI 的应用将会越来越广泛,Open AI …