清華大學AI 大模型性能報告 ChatGPT-4 榮登榜首但文心一言更懂中文

| 袁耀坤 | 16-08-2023 19:07 | |
清華大學AI 大模型性能報告 ChatGPT-4 榮登榜首但文心一言更懂中文

生成式AI 和大型語言模型開發無疑是今年全球科技界的焦點。從OpenAI 的 ChatGPT,到Google Bard和Meta 等科網巨頭相繼跟進AI 大模型的開發。最近,清華大學新聞與傳播學院發布了一份綜合性能評估報告,對國內外的大型語言模型進行了比較。在這份報告中,列出了7個大型語言模型的排名。毫無懸念的是,GPT-4榮登第一位,緊隨其後的是百度的文心一言,而GPT-3.5則位列第三。接下來是Claude、訊飛星火、阿里雲的通義千問以及崑崙的天工。

清華大學AI 大模型性能報告 ChatGPT-4 榮登榜首但文心一言更懂中文
今年,生成式人工智能和大型语言模型的开发成为全球科技界的焦点。从OpenAI的ChatGPT到Google Bard和Meta等科技巨头纷纷加入大型AI模型的开发。最近,清华大学新闻与传播学院发布了一份综合性能评估报告,对国内外的大型语言模型进行了比较。报告列出了7个大型语言模型的排名。毫无悬念的是,GPT-4位居第一,百度的文心一言紧随其后,GPT-3.5排名第三。接下来分别是Claude、讯飞星火、阿里云的通义千问和昆仑的天工。

↓↓↓同場加映:【e+同你試】菲林攝影入門攻略:菲林篇 實測 LomoChrome Color ‘92 拍攝效果↓↓↓

即刻【按此】,用 App 睇更多產品開箱影片

快科技 10日報道,清華大學新聞與傳播學院發布了《大語言模型綜合性能評估報告》,對國內外的大型語言模型進行了比較。該報告還研究了這些模型在多個領域的表現,包括創意寫作、代碼編程、輿情分析和歷史知識等,以及它們在解決實際問題時的有效性和局限性。綜合考慮生成質量、使用性能和安全合規等三個方面,對目前市場上的7個大型語言模型進行了全面評估。在這7個模型中,GPT-4毫無疑問地獲得了第一名,緊隨其後的是百度的文心一言,其次是GPT-3.5。其餘的模型依次是Claude、訊飛星火、阿里雲的通義千問和崑崙的天工。

清華大學AI 大模型性能報告 ChatGPT-4 榮登榜首但文心一言更懂中文

儘管GPT-4在各個方面處於領先地位,但對於國內用戶而言,更懂中文的大型語言模型才是關鍵。在這方面,百度的文心一言表現更出色。在中文語義理解的部分,文心一言以92%的得分率位居榜首,超過了訊飛星火和GPT-4。這一成績與百度的大型語言模型包含大量中文文本有關,因此它能夠更好地處理與本土文化相關的內容。

【熱門報道】

【熱門報道】

Source:快科技

Page 1 of 13