久久精品99-久久精品99无色码中文字幕-久久精品成人免费网站-久久精品高清-人人澡人人澡人人看青草-人人做人人爽人人爱秋霞影视

首頁 > 互聯網 > 正文

世界觀察:大模型在工業領域探索仍處于初級階段

2023-07-06 08:53:31來源:人民郵電報  


【資料圖】

圖片來源:中國工業互聯網研究院

近日,中國工業互聯網研究院(以下簡稱“工聯院”)針對人工智能大模型在中文工業領域的應用性能、技術架構、標準體系進行系統性評測,并發布系列報告。評測對象涵蓋GPT-4、GPT-3.5、文心一言、ChatGLM等國內外具有代表性的頭部大模型。

本次工業知識問答測試主要分為客觀題與主觀題兩大類,總計超過1100個問題。主觀題主要考察四大維度:基礎能力、語句能力、概括能力和邏輯能力。評測結果顯示,GPT-4表現最佳。國內頭部大模型表現亮眼,整體與GPT-3.5相當。其中百度文心一言在國內大模型中排名第一。

在客觀題方面,GPT-4與文心一言表現優于其他大模型。但評測結果也同時指出,大模型在準確率方面有較大的提升空間。在主觀題方面,國內大模型的基礎能力、語句能力與GPT-4接近,概括能力、邏輯能力與GPT-4存在一定差距。

評測數據集由工業領域八大行業的相關數據構成。包括電子設備制造業、裝備制造業、鋼鐵行業、采礦行業、電力行業、石化化工行業、建材行業和紡織行業。工聯院根據工業經驗,結合外部數據源,按行業構建行業知識測試集。

從行業維度看,大模型在八個行業知識問答能力上差異明顯,個別行業需進一步優化提升。其中,電子、裝備行業評價指數較高,紡織、采礦行業綜合評價指數相對較低。

分析大模型落地垂直行業痛點,豐富特定行業專業知識。雖然國內大模型在本次評測中表現較好,甚至在部分行業評分優于GPT-3.5,但工聯院評測報告指出,國內外通用大模型在工業知識問答領域探索仍處于初級階段,國內大模型與GPT-4有差距,行業間的泛化能力有待加強。對此,工聯院評測報告給出的建議是進一步豐富相關專業領域的數據訓練集,進行專業化的微調。 

標簽:

相關閱讀

相關詞

推薦閱讀

主站蜘蛛池模板: 国产短视频精品一区二区三区 | 三级黄色片网站 | 国产午夜在线视频 | 一级毛片特级毛片免费的 | 欧美色综合高清视频在线 | 日韩一级一片 | 欧美一级黄色片免费看 | 亚洲欧美一区二区三区国产精品 | 国内精品伊人久久久影视 | 午夜看看 | 日韩欧美国内 | 欧美激情xxxx| 国产精品麻豆一区二区 | 一区二区三区免费精品视频 | 好男人社区成人影院在线观看 | 羞羞视频免费观 | 一级一级人与动毛片 | 亚洲天堂网在线观看 | 麻豆国产在线观看免费 | 福利社午夜剧场 | 96xxxxx日本人| 日韩欧美一级大片 | 欧美在线观看你懂的 | 日韩在线www| www亚洲天堂 | 成人免费观看www在线 | 午夜成年人网站 | 欧美成人一区二区三区不卡视频 | 日本aⅴ在线不卡免费观看 日本aaa大片 | 最近免费手机中文字幕3 | 日韩18在线观看 | 日日草视频 | 色综合久久加勒比高清88 | 18性夜影院午夜寂寞影院免费 | 国产精品一区二区国产 | 欧美激情视频免费 | 国产精品欧美日韩 | 免费看又黄又爽又猛的视频软件- | 亚洲欧美人成综合导航 | 夜夜嗨视频网 | 永久免费视频网站在线观看 |