国产日韩精品一区二区_欧美一级片在线播放_久久精品中文字幕电影_久久视频精品在线_亚洲国产成人久久综合一区_久久精品国产精品_国产视频精品免费播放_在线视频中文亚洲_亚洲午夜未满十八勿入免费观看全集_精品亚洲一区二区_国产原创欧美精品_国产色综合天天综合网_九九久久国产精品_欧美极品少妇xxxxⅹ裸体艺术_亚洲国产精品人人爽夜夜爽_尤物九九久久国产精品的分类

  • 首頁 > 云計算頻道 > 大模型

    研究發現,GPT 和其他AI模型無法分析SEC備案文件

    2023年12月20日 20:17:09 來源:站長之家

      一家名為 Patronus AI 的初創公司的研究人員發現,大型語言模型在分析美國證券交易委員會(SEC)備案文件時經常無法正確回答問題。即使是表現最佳的人工智能模型配置 OpenAI 的GPT-4-Turbo,當給予幾乎整個備案文件的閱讀能力和相關問題時,僅有79% 的問題回答正確。Patronus AI 的創始人告訴 CNBC,這些所謂的大型語言模型有時會拒絕回答問題,或者會 “產生幻覺”,出現備案文件中不存在的數字和事實。

      Patronus AI 的聯合創始人 Anand Kannappan 表示:“這種性能水平完全不能接受。要想實現自動化和投入生產使用,性能必須更高。” 這些發現凸顯了 AI 模型在大公司中應用的一些挑戰,尤其是在金融等受監管行業。這些公司希望將先進技術應用于客戶服務或研究,但 AI 模型面臨一些困難。

      快速提取重要數字并對財務陳述進行分析被認為是聊天機器人最有前景的應用之一,自去年底發布 ChatGPT 以來一直備受關注。SEC 備案文件中充滿著重要的數據,如果一個機器人能夠準確地概括這些文件或快速回答相關問題,它可以使用戶在競爭激烈的金融行業中占據優勢。

      在過去的一年里,彭博社開發了自己的金融數據 AI 模型,商學院教授研究了 ChatGPT 是否可以解析財經頭條新聞,摩根大通正在開發一個基于 AI 的自動投資工具。根據 CNBC 之前的報道,生成式 AI 預計每年可以為銀行業帶來數萬億美元的收益。

      然而,GPT 進入該行業并不順利。微軟首次推出使用 OpenAI 的 GPT 的必應聊天時,其主要示例之一是使用聊天機器人快速概述盈利新聞稿。觀察人員很快就意識到微軟示例中的數字是錯誤的,一些數字完全是虛構的。

      Patronus AI 的聯合創始人表示,將大型語言模型應用于實際產品的挑戰之一是,它們是非確定性的,不能保證每次給出相同的輸出。這意味著公司需要進行更嚴格的測試,以確保它們的模型運行正確,不會偏離主題,并提供可靠的結果。

      該公司的創始人在 Facebook 的母公司 Meta 公司相識,他們在該公司從事與理解模型生成答案的問題以及使其更加 “負責任” 方面的 AI 問題。他們成立了 Patronus AI,該公司已從 Lightspeed Venture Partners 獲得種子資金,旨在通過軟件實現對大型語言模型的自動化測試,以便公司可以確保其 AI 機器人不會以離題或錯誤的答案令客戶或員工感到驚訝。

      Patronus AI 致力于編寫一套由主要上市公司的 SEC 備案文件中提取的10,000多個問題和答案,該數據集被稱為 FinanceBench。數據集包括正確答案,以及在任何給定備案文件中準確查找答案的位置。并非所有答案都可以直接從文本中提取,有些問題需要輕微的數學或推理。

      Patronus AI 測試了四個語言模型:OpenAI 的 GPT-4和 GPT-4-Turbo,Anthropic 的 Claude2和 Meta 的 Llama2,使用該公司生成的150個問題的子集進行測試。他們還測試了不同的配置和提示方式,例如將 OpenAI 模型在問題中給出與答案相關的確切源文本的 “Oracle” 模式。在其他測試中,模型被告知底層 SEC 文件存儲的位置,或者在提示中包含 “長上下文”,即幾乎完整的 SEC 備案文件與問題一起提供。

      GPT-4-Turbo 在該公司的 “閉卷” 測試中失敗,該測試不允許其訪問任何 SEC 源文件。它在被問到的150個問題中,未能回答88% 的問題,只有14次給出了正確答案。當獲得對底層備案文件的訪問權限時,其性能有了顯著改善。在 “Oracle” 模式下,GPT-4-Turbo 在85% 的情況下正確回答問題,但仍然在15% 的情況下給出了錯誤答案。然而,這種測試方式并不現實,因為它需要人工輸入以找到備案文件中確切的相關位置,而這正是許多人希望語言模型能夠解決的問題。

      Meta 開發的開源 AI 模型 Llama2在獲得各種底層文件的訪問權限時,產生了一些最糟糕的 “幻覺”,錯誤回答的比例高達70%,僅有19% 的回答正確。Anthropic 的 Claude2在提供 “長上下文” 的情況下表現良好,可以回答75% 的問題,21% 的回答錯誤,僅有3% 的問題未能回答。GPT-4-Turbo 在長上下文測試中表現也不錯,79% 的問題回答正確,17% 的回答錯誤。

      在進行測試后,Patronus AI 的創始人對模型的表現感到驚訝,即使在指導答案所在位置的情況下,它們的表現仍然很差。“即使答案在上下文中,模型拒絕回答的頻率也非常高,而人類是可以回答的。”Qian 說道。然而,即使模型表現良好,仍然不夠好,Patronus AI 發現。“即使模型在20次中回答錯誤1次,這個錯誤率對于受監管的行業來說仍然不可接受。”Qian 說道。

      然而,Patronus AI 的創始人認為,像 GPT 這樣的語言模型在金融行業中有巨大的潛力,無論是分析師還是投資者,如果 AI 技術繼續改進。“我們確實認為結果可能非常有希望。”Kannappan 表示,“隨著時間的推移,模型將會變得更好。我們非常有希望在長期內,很多工作可以實現自動化。但是現在,你肯定需要至少一個人參與來支持和引導你的工作流程。”

      文章內容僅供閱讀,不構成投資建議,請謹慎對待。投資者據此操作,風險自擔。

    海報生成中...

    最新新聞

    熱門新聞

    即時

    全球頂級AI創作社區回歸!海藝AI國內首發“全民娛樂化創作

    海藝AI的模型系統在國際市場上廣受好評,目前站內累計模型數超過80萬個,涵蓋寫實、二次元、插畫、設計、攝影、風格化圖像等多類型應用場景,基本覆蓋所有主流創作風格。

    新聞

    市場占比高達35.8%,阿里云引領中國AI云增長

    9月9日,國際權威市場調研機構英富曼(Omdia)發布了《中國AI云市場,1H25》報告。中國AI云市場阿里云占比8%位列第一。

    企業IT

    華為坤靈發布IdeaHub千行百業體驗官計劃,助力中小企

    9月24日,華為坤靈召開“智能體驗,一屏到位”華為IdeaHub千行百業體驗官計劃發布會。

    3C消費

    雅馬哈推出兩款高端頭戴耳機YH-4000與YH-C3000

    雅馬哈昨日宣布推出兩款頭戴式耳機,分別是平板振膜的YH-4000和動圈原理的YH-C3000。

    研究

    IDC:2025上半年全球智能家居清潔機器人出貨量同比暴

    IDC今日發布的《全球智能家居清潔機器人設備市場季度跟蹤報告,2025年第二季度》顯示,上半年全球智能家居清潔機器人市場出貨1,2萬臺,同比增長33%,顯示出品類強勁的市場需求。

    国产日韩精品一区二区_欧美一级片在线播放_久久精品中文字幕电影_久久视频精品在线_亚洲国产成人久久综合一区_久久精品国产精品_国产视频精品免费播放_在线视频中文亚洲_亚洲午夜未满十八勿入免费观看全集_精品亚洲一区二区_国产原创欧美精品_国产色综合天天综合网_九九久久国产精品_欧美极品少妇xxxxⅹ裸体艺术_亚洲国产精品人人爽夜夜爽_尤物九九久久国产精品的分类
    亚洲一区二区三区高清| 成人国产亚洲欧美成人综合网| 国产一区二区三区在线观看免费视频| 三上悠亚亚洲一区| 精品三级av在线导航| 欧美18免费视频| 在线亚洲午夜片av大片| 日本不卡高清| 国产精品久久精品日日| 亚洲色图综合久久| av电影天堂一区二区在线观看| 国产精品美女午夜爽爽| 国产免费拔擦拔擦8x高清在线人| 日本a级片久久久| 蜜桃av在线| 极品少妇一区二区三区精品视频| 久久av一区二区三区漫画| 久久久久久综合| 永久免费在线观看视频| 久久综合久久88| 岛国大片在线观看| 精品999日本久久久影院| 999精品网| 91综合视频| 一区一区三区| h视频在线免费观看| 国产精品永久免费视频| 久久久美女艺术照精彩视频福利播放| 欧美大奶一区二区| 国产亚洲欧美另类中文| 久久久久久久999精品视频| 五月天婷婷综合| 日韩av片电影专区| 国产手机视频精品| 亚洲第一区在线| 国产日韩欧美一二三区| 国产农村妇女精品一二区| 4438x亚洲最大成人网| 中文天堂在线一区| 黄色成人91| 一区二区三区国产视频| 国产一区二区在线视频| 成人爽a毛片免费啪啪| 亚洲精品写真福利| 成人免费看片网站| 亚洲国产日韩美| 日韩av免费在线看| 成人激情免费视频| 水蜜桃在线视频| 精品一区二区国语对白| 午夜精品久久久久久久久久久久久| 国产精品久久久网站| 国产高清精品一区二区三区| 亚洲精品电影久久久| 国产视频亚洲视频| 亚洲天堂男人| av亚洲产国偷v产偷v自拍| 国产原创一区二区三区| 久久亚洲国产精品成人av秋霞| 操喷在线视频| 国产毛片在线| 欧美精品黑人性xxxx| 亚洲盗摄视频| 136fldh精品导航福利| 久久99精品一区二区三区| 午夜精品一区二区三区三上悠亚| 国产精品久久中文| 偷窥少妇高潮呻吟av久久免费| 国内精品视频在线| 日本大香伊一区二区三区| 亚洲日产av中文字幕| 国产激情在线观看| 精品在线欧美视频| 久久久久久久性潮| www.在线视频| 91精品免费在线| 91精品国产综合久久婷婷香蕉| 日本一区二区三区中文字幕| 伊人久久久久久久久久| 亚洲第一福利网站| 国产一区二区三区成人欧美日韩在线观看| 国自产精品手机在线观看视频| 欧美巨大丰满猛性社交| 亚洲欧美综合区自拍另类| 538视频在线| 乱人伦中文视频在线| 欧美xxxx中国| 欧美精品色网| 亚洲老头老太hd| 小黄鸭精品aⅴ导航网站入口| 亚洲自拍偷拍一区| 日韩区欧美区| 青青草成人在线观看| 第四色成人网| 香蕉av777xxx色综合一区| 国产视频亚洲精品| 毛片av一区二区三区| 极品中文字幕一区| 欧美久久久久久一卡四| 麻豆精品在线看| 日本不卡一区二区| www.精品国产| 国产精品视频精品| 亚洲欧美综合| 欧美96一区二区免费视频| 国产成人精品电影久久久| 成人在线黄色| 国产成人一区二区三区小说| 深夜视频一区二区| av动漫一区二区| 免费不卡在线观看| 亚洲欧美在线播放| 欧美黑白配在线| 国产亚洲精品高潮| 中文字幕免费一区二区| 久久电影网站中文字幕| 精品久久久久久久久久久下田| 亚洲色图美女| 亚洲欧美电影在线观看| 日产精品久久久一区二区| 亚洲精品久久久久中文字幕欢迎你| 电影k8一区二区三区久久| 久久久婷婷一区二区三区不卡| 蓝色福利精品导航| 一区二区中文视频| 欧美俄罗斯性视频| 97精品资源在线观看| 日韩区在线观看| 91wwwcom在线观看| 日韩影院精彩在线| 日本成人一区二区| 亚洲国产精品久久久久久女王| 成人精品一区二区| 日本免费高清一区| 亚洲欧美一区二区三区久久| 国产精品毛片久久久| 欧美性猛交xxxx| 尤物在线网址| 牛牛影视一区二区三区免费看| 毛片网站在线免费观看| 无码一区二区三区视频| 亚洲一区亚洲二区亚洲三区| 精品久久久久久久中文字幕| 欧美成人性生活视频| 欧美码中文字幕在线| 毛片一区二区| 欧美xxxx免费虐| 欧美黄色性视频| 国产aⅴ精品一区二区三区色成熟| 亚洲欧美网站在线观看| 久久精品99无色码中文字幕| 国产在视频线精品视频www666| 中文字幕国产精品久久| 欧美不卡一区二区| 亚洲精品国产嫩草在线观看| 欧美www在线| 一区二区精品| 精品国产一区二区三区噜噜噜| 国产乱码精品1区2区3区| 亚洲精品99久久久久中文字幕| 美女久久久久| 日韩av三区| 日韩电影网1区2区| 九色精品国产蝌蚪|