今年春節(jié)檔的中國科幻電影《流浪地球2》以氣勢恢宏、震撼人心、美輪美奐的視覺奇景而又極具現(xiàn)實(shí)意義的科幻設(shè)定引起了熱議,“燃爆”全網(wǎng),全球圈粉。片中領(lǐng)航站空間的核心智能主機(jī)MOSS以其趨于完美的智慧讓大家對科技強(qiáng)國的繁榮盛景充滿了無限想象與期待。無獨(dú)有偶,去年11月30日美國人工智能研究公司OpenAI推出的聊天機(jī)器人ChatGPT火爆全球,一時(shí)間作為現(xiàn)象級(jí)消費(fèi)類人工智能應(yīng)用,再次引發(fā)人工智能熱潮。本期,我們對“生成式人工智能”進(jìn)行專題解讀。
人工智能(Artificial Intelligence,AI)是計(jì)算機(jī)學(xué)科的一個(gè)分支,作為21世紀(jì)三大尖端科技之一,是研究用于模擬、延伸和擴(kuò)展人的智能的理論、方法、技術(shù)及應(yīng)用系統(tǒng)的一門技術(shù)科學(xué)。人工智能的目標(biāo)是使機(jī)器能夠像人一樣完成一些復(fù)雜的任務(wù),例如語音識(shí)別、圖像識(shí)別、機(jī)器翻譯、自動(dòng)駕駛、醫(yī)學(xué)診斷等。
人工智能的誕生可以追溯到1956年,美國達(dá)特茅斯學(xué)院舉行了歷史上第一次人工智能研討會(huì),約翰·麥卡錫等科學(xué)家認(rèn)為機(jī)器可以像人類一樣學(xué)習(xí)、記憶、思考、判斷和解決問題,人工智能這門學(xué)科由此誕生。
人工智能的發(fā)展走過60多年,經(jīng)歷了兩次低谷和三次高潮,目前已廣泛應(yīng)用在各領(lǐng)域,如智能交通、智能醫(yī)療、智能金融、智能制造、智能安全、智能物流等。人工智能被視為眾多智能產(chǎn)業(yè)發(fā)展的突破點(diǎn)、新一輪產(chǎn)業(yè)變革的核心驅(qū)動(dòng)力、一項(xiàng)引領(lǐng)未來的戰(zhàn)略技術(shù)。
人工智能
生成式人工智能(Generative AI)是一類人工智能技術(shù),可以通過學(xué)習(xí)現(xiàn)有的數(shù)據(jù)并生成新的數(shù)據(jù),從而實(shí)現(xiàn)類似人類創(chuàng)造力的功能。與傳統(tǒng)的人工智能技術(shù)不同,生成式人工智能技術(shù)能夠創(chuàng)造出新的內(nèi)容,而不是只能根據(jù)輸入的數(shù)據(jù)進(jìn)行處理和分類。
生成式人工智能的關(guān)鍵技術(shù)在2013年以后有了重要發(fā)展。2014年,科學(xué)家蘭·J·古德費(fèi)羅提出了生成式對抗網(wǎng)絡(luò)GAN。2018年,英偉達(dá)公司發(fā)布了可以自動(dòng)生成高質(zhì)量圖片的StyleGAN模型。2019年,DeepMind公司發(fā)布了可以生成連續(xù)性視頻的DVD-GAN模型。2022年底,用于生成自然語言的ChatGPT橫空出世。2022年也被稱為AIGC元年。
AIGC(AI Generated Content)是指利用人工智能技術(shù)來生成內(nèi)容,從給定的數(shù)據(jù)中學(xué)習(xí)出模型,然后使用模型生成新的數(shù)據(jù)。根據(jù)其生成的內(nèi)容模態(tài)不同,可分為文本、視頻、圖像、音頻與跨模態(tài)生成。AIGC是繼專家生成內(nèi)容(Professionally Generated Content,PGC)、用戶生成內(nèi)容(User Generated Content,UGC)之后的新型內(nèi)容生產(chǎn)方式。隨著生成式人工智能技術(shù)不斷迭代發(fā)展,人工智能生成內(nèi)容種類多樣、豐富且效果逼真,生成方式逐漸由PGC、UGC轉(zhuǎn)變?yōu)槿斯ぶ悄茌o助生產(chǎn)內(nèi)容生成(AI Assisted Generated Content)。
生成式人工智能
ChatGPT
ChatGPT是OpenAI推出的一款基于Transformer模型的自然語言生成技術(shù)構(gòu)建的人工智能聊天機(jī)器人。
ChatGPT能夠根據(jù)用戶的文本輸入,產(chǎn)生相應(yīng)的回答,還能夠撰寫文章、文本摘要,進(jìn)行翻譯,生成計(jì)算機(jī)代碼。它支持連續(xù)多輪對話,承認(rèn)錯(cuò)誤、承認(rèn)無知、質(zhì)疑不正確的前提并拒絕不恰當(dāng)?shù)恼埱?。ChatGPT在對話的過程中能夠記憶先前的對話訊息,并進(jìn)行上下文理解,以回答某些假設(shè)性的問題。與其他現(xiàn)有聊天機(jī)器人相比,ChatGPT極大提升了對話交互模式下的用戶體驗(yàn)。
根據(jù)用戶的文本輸入產(chǎn)生相應(yīng)回答,ChatGPT解決的是一個(gè)關(guān)于自然語言處理的序列生成類型的問題。人類使用自然語言表達(dá)一個(gè)句子時(shí),其中的詞通常是有先后順序的,一段話中,前后語句是有聯(lián)系的,因此,通常采用機(jī)器學(xué)習(xí)中的序列模型來解決該類問題。
ChatGPT是通過基于Transformer的大型預(yù)訓(xùn)練模型和基于人類反饋的強(qiáng)化學(xué)習(xí)(Reinforcement Learningfrom Human Feedback,RLHF)兩階段實(shí)現(xiàn)而成。第一階段的大型預(yù)訓(xùn)練模型為ChatGPT的基礎(chǔ)模型,采用的是基于Transformer的預(yù)訓(xùn)練范式。在第二階段中,ChatGPT采用RLHF解決大語言模型的不一致問題。
Transformer是一種基于注意力機(jī)制的深度神經(jīng)網(wǎng)絡(luò)序列模型。注意力機(jī)制可以幫助模型更好捕捉輸入數(shù)據(jù)中的重要特征,而不是像傳統(tǒng)模型那樣對所有特征“一視同仁”,注意力機(jī)制有效提高了模型的準(zhǔn)確性?;A(chǔ)模型使用了多層的注意力機(jī)制來處理輸入序列,以此捕捉句子級(jí)別的依賴關(guān)系。
ChatGPT生成的語言自然流暢,這得益于基礎(chǔ)模型通過大量的高質(zhì)量網(wǎng)絡(luò)文本數(shù)據(jù)學(xué)習(xí)出自然語言的語法和語義。這些文本數(shù)據(jù)來自Common Crawl、新聞文本數(shù)據(jù)、Reddit評論數(shù)據(jù)、書籍、維基百科及其他文本數(shù)據(jù)。
與ChatGPT相比,此前發(fā)布的GPT1-3是一種通用模型,可以用于多種自然語言處理任務(wù),比如文本分類、文本生成、文本摘要,而ChatGPT模型專注于聊天機(jī)器人,根據(jù)上下文和歷史對話,使得生成的回復(fù)更加貼切。
ChatGPT發(fā)布僅兩個(gè)月以來,活躍用戶就突破1億,全球大量用戶已經(jīng)開始嘗試使用該平臺(tái)協(xié)助撰寫電子郵件、開發(fā)代碼以及回答有關(guān)投資等一系列主題的問題。ChatGPT亮相Bing搜索和瀏覽器,被稱為微軟的“核彈級(jí)”更新,開啟了搜索引擎的新范式。Bing搜索引擎發(fā)布會(huì)上有趣的展示給人留下了深刻印象——人工智能助手在不到10秒的時(shí)間內(nèi)總結(jié)了GAP三季度長達(dá)15頁P(yáng)DF財(cái)報(bào)的要點(diǎn),接著根據(jù)“列個(gè)表和lululemon對比下”的指令,給出了財(cái)報(bào)要點(diǎn)對比表格。發(fā)布會(huì)的演示者指出,人工智能助手在購物、旅行規(guī)劃、飲食、娛樂、跨界學(xué)習(xí)、100多種語言的文本交流等方面可以提供咨詢和幫助。ChatGPT被亞馬遜用于各種不同的工作職能中,如回答面試問題、編寫軟件代碼和創(chuàng)建培訓(xùn)文檔等。ChatGPT通過了美國沃頓商學(xué)院的MBA考試以及美國醫(yī)師執(zhí)業(yè)資格考試。
ChatGPT的爆紅,成為人工智能時(shí)代資本定價(jià)的標(biāo)桿事件,OpenAI成為賬面上最值錢的美國初創(chuàng)公司之一,于今年1月獲得了微軟100億美元的投資。美國新媒體巨頭Buzzfeed宣布計(jì)劃采用ChatGPT協(xié)助內(nèi)容創(chuàng)作,其股價(jià)一夜間暴漲近120%,兩天內(nèi)飆升逾300%。采用了同類底層技術(shù)(GPT-3)的文案自動(dòng)生成平臺(tái)Jasper在成立僅18個(gè)月后就達(dá)到了15億美元的高估值,ChatGPT的巨大商業(yè)潛力不斷顯現(xiàn)。國內(nèi)科技龍頭企業(yè)也高度關(guān)注ChatGPT,百度的“文心一言”(ERNIE Bot)將在3月完成其ChatGPT產(chǎn)品的內(nèi)測,面向公眾開放。2月,騰訊也公布了一項(xiàng)實(shí)現(xiàn)機(jī)器與用戶自然順暢溝通的人機(jī)對話專利。
ChatGPT的優(yōu)勢與局限
ChatGPT的強(qiáng)大來自四個(gè)方面。一是借助于預(yù)訓(xùn)練模型,建立了基于注意力機(jī)制的大規(guī)模自監(jiān)督訓(xùn)練的基礎(chǔ)模型,極大減輕了對于標(biāo)注數(shù)據(jù)的依賴。二是使用了來自人類反饋的強(qiáng)化學(xué)習(xí)方案,提高了理解人類思維的準(zhǔn)確性。三是計(jì)算機(jī)硬件的改進(jìn)以及利用硬件并行性的Transformer模型架構(gòu)的提出,使得大規(guī)模訓(xùn)練數(shù)據(jù)成為可能。四是采用了大規(guī)模高質(zhì)量的真實(shí)數(shù)據(jù)及多任務(wù)精標(biāo)數(shù)據(jù)。這四個(gè)方面反映了算法、算力與海量數(shù)據(jù)集成在一起產(chǎn)生的巨大價(jià)值。
ChatGPT的缺點(diǎn)也比較明顯。例如,目前還并不具備網(wǎng)絡(luò)搜索功能,只能基于所擁有的數(shù)據(jù)集進(jìn)行回答;有時(shí)會(huì)給出看似合理但并不正確或甚至荒謬的答案;抵抗不安全的指令能力較差,存在過分猜測用戶意圖的問題;部分回復(fù)廢話較多、句式固定。另一方面,ChatGPT的訓(xùn)練數(shù)據(jù)達(dá)到了45TB,消耗了巨大的算力資源,訓(xùn)練時(shí)間長,這也致使很多公司和企業(yè)在自建道路上望而卻步。
ChatGPT與生成式人工智能的應(yīng)用潛力
ChatGPT成為人工智能從量變到質(zhì)變的轉(zhuǎn)折點(diǎn),對于文字模態(tài)的生成式人工智能應(yīng)用具有重要意義,其應(yīng)用場景大致可分為4類:信息查詢、專家咨詢、助手、交流,通過數(shù)字化勞動(dòng)替代枯燥重復(fù)性勞動(dòng)、擴(kuò)充資源稀缺勞動(dòng)力、協(xié)助人類完成相應(yīng)任務(wù)、滿足人類情感交流的需求。
ChatGPT可以依附于對話形態(tài)的產(chǎn)品和載體,如內(nèi)容創(chuàng)作、客服機(jī)器人、虛擬人、機(jī)器翻譯、游戲、社交、教育、家庭陪護(hù)等領(lǐng)域,這些或許都將是ChatGPT能快速落地的方向。
生成式人工智能借助大模型的跨模態(tài)綜合技術(shù)能力將在跨模態(tài)產(chǎn)業(yè)生態(tài)中逐漸成熟,跨模態(tài)生成技術(shù)的成熟是真正實(shí)現(xiàn)認(rèn)知和決策智能的轉(zhuǎn)折點(diǎn)?;谏墒饺斯ぶ悄芗夹g(shù)的數(shù)字內(nèi)容孿生、數(shù)字內(nèi)容創(chuàng)作以及數(shù)字內(nèi)容智能編輯有望在電子商務(wù)、傳媒、影視娛樂等領(lǐng)域改變內(nèi)容生產(chǎn)模式。
本版文字除署名外均由集團(tuán)公司郵政研究中心提供
更多關(guān)于 美國 的信息
商函中心美國必能寶系列封裝機(jī)維保服務(wù)采購項(xiàng)目招標(biāo)公告(2022-11-09)
安徽郵政9610美國商業(yè)專線首發(fā)成功(2022-02-17)
美國貨運(yùn)公司實(shí)施全天候服務(wù)(2021-11-25)
美國郵政榮登福布斯年度“美國最佳雇主”排行榜榜首(2021-10-14)
美國郵政推出咖啡永久郵票(2021-07-15)
接入點(diǎn):美國特色的包裹攬投點(diǎn)(2020-06-18)
美國“雙11”,is coming(2017-11-09)
郵政速遞物流牽手美國華人快遞公司(2016-10-19)
本站部分文章轉(zhuǎn)載于網(wǎng)上,版權(quán)歸原作者所有。如果侵犯您的權(quán)益,請Email和本站聯(lián)系!