遠(yuǎn)傳科技CEO嵇望先生受邀發(fā)表ChatGPT主題演講
3月10日,在中國人工智能學(xué)會(huì)、浙江省數(shù)字經(jīng)濟(jì)聯(lián)合會(huì)等機(jī)構(gòu)聯(lián)合主辦的“ChatGPT技術(shù)的創(chuàng)新與突破”專項(xiàng)論壇上,遠(yuǎn)傳科技CEO嵇望先生分享了遠(yuǎn)傳科技在推動(dòng)ChatGPT在知識(shí)領(lǐng)域應(yīng)用的思考和實(shí)踐。
2022年杭州市數(shù)字經(jīng)濟(jì)高質(zhì)量發(fā)展大會(huì)指出,杭州將以高水平重塑全國數(shù)字經(jīng)濟(jì)第一城,并堅(jiān)持把發(fā)展新一代人工智能作為建設(shè)全國“數(shù)字經(jīng)濟(jì)第一城”和“數(shù)字治理第一城”的重要領(lǐng)域。
而今年以來,人工智能領(lǐng)域的ChatGPT火爆全球。兩會(huì)期間,ChatGPT更是成功“火到兩會(huì)”,成為代表們熱議話題。
ChatGPT火爆的背后,反映了AI技術(shù)持續(xù)進(jìn)步、應(yīng)用場(chǎng)景不斷拓展的趨勢(shì)。同時(shí),ChatGPT的成功,也預(yù)示著人工智能產(chǎn)業(yè)界的新機(jī)遇。
對(duì)近期ChatGPT的爆火,杭州人工智能領(lǐng)域的政府領(lǐng)導(dǎo)、學(xué)術(shù)專家、企業(yè)代表共濟(jì)一堂,探索ChatGPT技術(shù)的創(chuàng)新與突破,為杭州AI產(chǎn)業(yè)發(fā)展尋找新機(jī)遇出謀劃策,為杭州重塑全國數(shù)字經(jīng)濟(jì)第一城獻(xiàn)計(jì)獻(xiàn)策。
遠(yuǎn)傳科技CEO嵇望先生表示,ChatGPT在泛知識(shí)管理有望得到廣泛應(yīng)用。
知識(shí)應(yīng)用領(lǐng)域主要分為知識(shí)管理和知識(shí)應(yīng)用兩大類,知識(shí)管理主要有知識(shí)管理平臺(tái)和知識(shí)共享平臺(tái),而知識(shí)圖譜、智能知識(shí)庫與問答對(duì)話系統(tǒng)則是知識(shí)應(yīng)用重要組成部分。
對(duì)知識(shí)的可用性取決于數(shù)據(jù)的可靠性和準(zhǔn)確性、語義一致性、可查詢性與可解釋性?;贑hatGPT在包括文本生成、回答問題、翻譯文本、邏輯及思維鏈能力等多方面不俗的表現(xiàn),其在數(shù)據(jù)采集、數(shù)據(jù)標(biāo)注、數(shù)據(jù)生成、問答對(duì)抽取、三元抽取五方面賦能知識(shí)工程。
·在數(shù)據(jù)采集方面,ChatGPT可以從各種在線資源中抓取文本數(shù)據(jù),并將其整理成結(jié)構(gòu)化數(shù)據(jù)。并且對(duì)從不同來源獲取的數(shù)據(jù)進(jìn)行清洗,從而提高數(shù)據(jù)的質(zhì)量和可用性。
·在數(shù)據(jù)采集完成后,ChatGPT可以使用自動(dòng)標(biāo)注算法來標(biāo)注數(shù)據(jù),然后通過人工審核來修正錯(cuò)誤。ChatGPT還可以使用傳統(tǒng)的機(jī)器學(xué)習(xí)算法和深度學(xué)習(xí)算法來標(biāo)注數(shù)據(jù)。
數(shù)據(jù)獲取后,ChatGPT進(jìn)行數(shù)據(jù)結(jié)構(gòu)化處理,主要包括問答式抽取和三元組抽取兩種途徑。
·對(duì)于問答對(duì)抽取這種方式,ChatGPT可以使用自然語言處理技術(shù)來從文本數(shù)據(jù)中提取問答對(duì)。ChatGPT可以使用命名實(shí)體識(shí)別和關(guān)系提取技術(shù)來識(shí)別問題和答案,并將其匹配成一對(duì)。
·而三元組抽取,CHATgpt可以使用命名實(shí)體識(shí)別技術(shù)來識(shí)別文本中的實(shí)體與關(guān)系,根據(jù)已有的三元組和實(shí)體關(guān)系來構(gòu)建知識(shí)圖譜。
遠(yuǎn)傳科技不斷擴(kuò)展人工智能的使用范圍,積極加速ChatGPT相關(guān)領(lǐng)域布局,在知識(shí)工程應(yīng)用探索了三大應(yīng)用場(chǎng)景:
·基于PDF文件問答對(duì)生成
用戶上傳 PDF 文件后,可以對(duì)它提問任何關(guān)于這份PDF的問題,只要上傳完成,便如同完全理解了這份PDF文檔一樣,立刻就可以提取出PDF文檔中的核心要點(diǎn),并提示用戶可以根據(jù)提示要點(diǎn)來提問。
·知識(shí)圖譜三元組抽取
以構(gòu)建基本知識(shí)圖譜的三元組抽取為核心,抽取包括主體、客體、主體與客體之間關(guān)系,在一段標(biāo)準(zhǔn)知識(shí)輸入后,可以自動(dòng)輸出由實(shí)體、屬性和值組成的三元組答案,能在很大程度上解決當(dāng)前ChatGPT的事實(shí)謬誤問題,提高答案的可解釋性。
·數(shù)據(jù)標(biāo)注
在數(shù)據(jù)標(biāo)注方面,則可以在輸入需標(biāo)注語料后,根據(jù)已設(shè)定的規(guī)則,將需標(biāo)注語料打上標(biāo)簽、自主識(shí)別、自動(dòng)分解并輸出經(jīng)過標(biāo)注后數(shù)據(jù)信息。通過這種標(biāo)記、注釋分類的過程,更好地識(shí)別和理解信息,提升問答的準(zhǔn)確性。
小結(jié)
作為數(shù)字經(jīng)濟(jì)第一城, 杭州有著人工智能的場(chǎng)景優(yōu)勢(shì)。面臨新機(jī)遇,搶抓新賽道。遠(yuǎn)傳科技借鑒ChatGPT等大規(guī)模語言模型與技術(shù),結(jié)合自身的智能交互技術(shù)優(yōu)勢(shì),將AI前沿技術(shù)與城市、與產(chǎn)業(yè)緊密結(jié)合,基于AI技術(shù)的數(shù)字化研究、場(chǎng)景化應(yīng)用,為杭州乃至全國數(shù)字化進(jìn)程貢獻(xiàn)自己的力量。