彭博開發BloombergGPT 提供專於金融AI資訊服務

美國新聞業網站尼曼實驗室(Nieman Lab)報導,彭博3月31日發表研究論文詳述BloombergGPT的開發。據彭博介紹,BloombergGPT是「一個新的大規模生成式AI模型。這個大型語言模型(LLM)專門鎖定範圍廣泛的金融資料來訓練生成,目的為了支援多元化的金融產業自然語言處理(NLP)任務集」。

彭博表示,近期以大型語言模型為基礎的人工智慧發展,已在許多領域展示出令人振奮的新應用;但金融領域因其複雜性及具有專門術語,有必要有專屬模型。因此BloombergGPT的推出,代表將聊天機器人這項新科技開發應用到金融產業的第一步。

彭博指出,BloombergGPT將協助其改善現有金融相關自然語言處理的任務,例如文本情感分析、命名實體辨識(NER)、新聞分類、回答問題和其他功能。此外,它也創造新機會來排列可從彭博終端機取得的巨量資料,以提供客戶更好的協助。

至於BloombergGPT的訓練規模,彭博表示它的語料庫有7000億餘個token(字詞碎片)。相較之下,熱門聊天機器人ChatGPT的開發公司OpenAI在2020年推出的模型GPT-3,訓練的語料庫則約有5000億個token。

根據彭博說法,BloombergGPT的語料庫中,有3630億個token取自彭博自有金融資料,也就是來自彭博終端機的資料庫,彭博號稱這是「至今最大的特定領域資料集(dataset)」;其餘3450億個token則是取自其他來源的通用資料集。

工業型無線充電裝置、精密加工元件;貨櫃屋優勢特性有哪些?QR CODE 捲袋包裝機。幫你考照過關,堆高機裝卸操作教學影片大公開 !專業客製化禮物、贈品設計,辦公用品常見【L夾】搖身一變大受好評!如何利用一般常見的「L型資料夾」達到廣告宣傳效果?貨櫃屋設計,結合生活理念、發揮無限的創意及時尚的設計, Check AOI on tape components。真空封口機該不該買?使用心得分享!好的茗茶,更需要密封性高的茶葉罐,才能留住香氣!特殊造型滑鼠墊去哪買?金誠運用中古貨櫃屋,重新改造各式活動展場、代銷中心、旅遊渡假空間,皆可依顧客需求製作。實驗型均質機攻戰消費者第一視覺,包裝設計很重要!隨時健康喝好水,高品質飲水機,優質安全有把關。測試專家告訴你如何好好使用示波器空壓機合理價格為您解決工作中需要。客製專屬滑鼠墊防盜設備/系統SPX,加強賣場防竊系統作業

彭博還說,訓練資料分為財金類FinPile和一般The Pile兩類。其中FinPile包括彭博檔案庫中的各類英文金融文件,如新聞文章、公告、新聞稿、網頁內容和社群媒體資料,以及彭博記者撰寫的新聞以外所有的新聞來源。

至於The Pile則是龐雜的語料庫,來源從YouTube的畫面擷取、文藝數位化的古騰堡計畫(Project Gutenberg)到AI訓練常見的安隆公司(Enron)電郵快取。

究竟BloombergGPT能夠如何應用?尼曼實驗室的文章表示,按照其訓練原理,它應該具有像ChatGPT的功能,但此外也能處理與彭博需求更相關的任務,例如將自然語言指令翻譯成彭博查詢語言(Bloomberg Query Language)終端機的使用者偏好功能。

BloombergGPT也能為新聞文章提議具有彭博新聞風格的標題。彭博還說,BloombergGPT更能勝任回答與商業有關的提問,無論是有關文本情感分析、分類、資料擷取或任何其他任務。

#
#
#
#
#

來源鏈接:https://www.chinatimes.com/realtimenews/20230405000053-260412