生成式 AI(Generative AI 或 AIGC)
是利用现有文字(zi)、影音(yin)文件或(huo)图象(xiang)建(jian)立
新(xin)知识的(de)专业(ye)技(ji)术(shu)。过去(qu)一(yi)年,其技(ji)术(shu)的(de)
进度主(zhu)要来自于三大(da)领(ling)域:图(tu)象生成领(ling)
域,以(yi) DALL·E-2、Stable Diffusion 为
所代表的(de)扩散模型(Diffusion Model);
自然(ran)语(yu)言理解(jie)(NLP)领域根据 GPT-3.5
的 ChatGPT;代码生成领域根(gen)据 Codex
的(de) Copilot。目前的(de)生成式 AI 通常被
用于生成产品原(yuan)(yuan)型(xing)或原(yuan)(yuan)稿,应用领域(yu)涵
盖图(tu)文创作、代码生成、手(shou)机游戏、广告宣传、
造(zao)型艺术广告(gao)设(she)计等。将来,生成式 AI 将成为
为(wei)一项平民(min)化基(ji)础(chu)技术,极大的提高
智(zhi)能化视频(pin)的丰(feng)富(fu)度、创造力(li)与生产效
率(lv),其(qi)应用界限都将伴(ban)随着(zhe)技术的发展与
成本的降低拓展到(dao)大量领域。
发展趋势十
生成式(shi) AI 使用(yong)各种人工智(zhi)能算法,
从数据中学(xue)到因素,使设备(bei)可以创
建一个全新的数字信息、图象、文字、声频(pin)或(huo)
编码等相(xiang)关(guan)信息。它建立出(chu)的内容与训练数(shu)据
维持(chi)类似(si),并非拷贝(bei)。它的发展归功于近(jin)
年以来大模型在(zai)基础科(ke)研特别是深度神经(jing)网(wang)络上
的创(chuang)新(xin),真正数据(ju)库的不断积(ji)累(lei)核算成本的后
降。在过去这一年,生成(cheng)式 AI 将(jiang)人(ren)工智
平衡(heng)的使用价值聚焦到“造就”二字,标志着人
工智能逐渐具(ju)有定义和展现新生事物的能力(li)。
过去(qu)一年(nian),生成式 AI 的进展(zhan)关键体(ti)
如今如下所示领域:
图象生成领域(yu)的(de)进展来源于扩散模(mo)型(xing)
(Diffusion model)的 应 用(yong),以(yi) DALL·
E-2、Stable Diffusion 为首。扩散模型
是一种从噪音中生成(cheng)图像的(de)人工(gong)智能算法。
扩散模型技术性(xing)背(bei)后,是更(geng)准确了解人们
词义的预训练模型、及其(qi)文字与(yu)图象统一
表(biao)明实体模型(CLIP)支撑。它的存在,让
图(tu)象生成越(yue)来越(yue)更具有想(xiang)像力。
自然语(yu)言(yan)理解(jie)(NLP)领域的进(jin)展来(lai)
自于根据 GPT3.5 的 ChatGPT(Generative
Pre-trained Transformer)。这也是一(yi)种基于(yu)
互联网技术可(ke)以用数据训练的文字生成深度神经网络
实体模型,用以互动问答、文本(ben)摘要生(sheng)成、设备(bei)翻
译、归类、代(dai)码生(sheng)成(cheng)和会话 AI。归功于文
本(ben)和编(bian)码结合的预(yu)训练(lian)大(da)模型的高速发展,
ChatGPT 引进了(le)人(ren)工标注数据和增强学习(xi)
(RLHF)去进行不断(duan)练习和改进。添加强
化课程后(hou),大模型能理解人们(men)的指令(ling)以
及(ji)身后的内涵,依据人们意(yi)见反馈来判定回答
的(de)品质,得出可(ke)解释性的(de)回答,并(bing)针(zhen)对不符合
适(shi)的难题得出有效的回应(ying),形成一个可(ke)迭
代反映的闭环控制。
代码生(sheng)成领域的进展来源于代码生(sheng)成系
统 AlphaCode 和 Copilot。2022 年(nian) 2 月(yue),
Deepmind 发(fa)布了他们的(de)最新研(yan)究成果
AlphaCode。这是一(yi)个可以(yi)独立程序编写的系
统(tong),在 Codeforces 举行的(de)编程竞赛中,超
过去了 47%人类技术工程(cheng)师(shi)。标志(zhi)着 AI 代
码生成(cheng)系统(tong)软件,**次(ci)在编程竞赛中,达到(dao)
具有竞争力的(de)水准(zhun)。根据(ju)开(kai)放(fang)源码(ma)锻炼的(de)
Copilot 逐渐商业化的,做(zuo)为订阅(yue)服务(wu)发放给
开(kai)发人员(yuan),用(yong)(yong)户(hu)可以通过应用(yong)(yong) Copilot 全自动(dong)补
全编码。Copilot 作(zuo)为一(yi)个根据大中型语言表(biao)达模
型(xing)的(de)软件,虽(sui)然在大(da)多数(shu)情(qing)况(kuang)下仍然需要人工
二(er)次调整,但简易、可重复性的代码生成(cheng)上,
将(jiang)帮助开发人员提(ti)高工(gong)作效率,并为 IDE(集
成开发工(gong)具)行(xing)业带来深(shen)远影响。
伴随着(zhe)具体内容创造出来的井喷式增长,怎样做
到信息(xi)在(zai)质(zhi)量与(yu)语义上的可(ke)控(kong)性,变成可(ke)控(kong)性
式生(sheng)成(cheng),无疑是生(sheng)成(cheng)式 AI 所面临的关键(jian)考验(yan)。
在产业(ye)发展领域,降(jiang)低成本仍然是重要考验。只
有象 ChatGPT 这(zhei)种级别的模型(xing)训练费用和(he)推
理(li)成本费充(chong)足低,才可能产(chan)业化营销(xiao)推广。除此之外,
数据库的(de)安全可控、写作(zuo)著作(zuo)权(quan)和信任问题也
必须伴随(sui)着产业发(fa)展(zhan)加速逐(zhu)一(yi)处(chu)理(li)。
未来三年(nian),生(sheng)成式(shi) AI 将踏入创新产(chan)品
变(bian)的快速(su)道路(lu),在运营模式上会越来越多探寻(xun),
产业生态会随着运用的兴起不断完善。届
时,生成式(shi) AI 内容(rong)造就能力有望突破人们
水准。有着数(shu)据信息(xi)、测算能(neng)力、实用化工作经验的
大(da)中型(xing)科技(ji)有限公司将成为生成式 AI 落地关(guan)键
参(can)加者(zhe)。根据生成模(mo)型测算(suan)基础设施建设友谊
台(tai)会逐步发(fa)展下去,实体模型变为随手可(ke)得(de)的服(fu)
务,顾客不(bu)用(yong)布署和运行(xing)生成式模型专
业专业技(ji)能就可(ke)以使用。生(sheng)成实体模型(xing)将于互动能力、
安全(quan)可信、认知智能中取(qu)得明显进度(du),以辅
助人们进行各种创造性工作