国产日韩精品一区二区_欧美一级片在线播放_久久精品中文字幕电影_久久视频精品在线_亚洲国产成人久久综合一区_久久精品国产精品_国产视频精品免费播放_在线视频中文亚洲_亚洲午夜未满十八勿入免费观看全集_精品亚洲一区二区_国产原创欧美精品_国产色综合天天综合网_九九久久国产精品_欧美极品少妇xxxxⅹ裸体艺术_亚洲国产精品人人爽夜夜爽_尤物九九久久国产精品的分类

第四屆人工智能與產業鏈創新高層論壇暨2025寧波智能產品創新大賽圓滿落幕達到金牌分數線:字節跳動推出新一代數學推理專用模型Seed Prover 1.5小鵬X9超級增程全球首發冰雪穩行系統:100km/h剎停不跑偏光帆科技全球首款具備視覺感知能力的主動式AI耳機正式發布拼多多入選2025年《中國優秀品牌發展案例》以創新赴約,為未來賦能!鯤鵬昇騰創新大賽2025全國總決賽即將開賽聯想ThinkCentre X AIO Aura Edition 一體機曝光:27.6 英寸 16:18 屏幕阿福和靈光,能承載螞蟻的TO C野心嗎?啟信慧眼AI驅動智能商業決策,推動商業大數據B端市場革新TCL冠軍中國行,奧運冠軍趙蕊蕊見證小藍翼新一代AI健康空調發布冠軍見證,TCL空調雙新品亮相:定義年輕人“冠軍級”舒適生活中國第一具身大模型獲21億元融資,銀河通用機器人估值突破200億機構:生成式AI與自主AI代理推動電信客戶體驗框架轉型國產替代加速!900次場景落地,天數智芯釋放 AI 算力高成長潛力卡薩帝廚電感恩月推出烤餃子、蒸餃子活動-25℃冰雪大世界人群涌向海爾“溫暖方舟”2025未來產業系列對接活動(陜西行) 成功舉辦仰望U9專屬紀念色“極境森林”上市 售價188萬元!本田放大招!2026全球4款新車曝光 純電0系列量產在即6K 3D、首款1040Hz顯示器降臨!三星Odyssey 2026系列炸場
  • 首頁 > 企業IT頻道 > 人工智能

    多模態大模型「卷」向智能文檔,只為解放打工人的雙手

    2023年05月24日 12:15:09 來源:AI科技評論

      來源:AI科技評論

            作者 | 黃楠

      編輯 | 陳彩嫻

      今年3月,上海靜安區警方接到了一則關于虛擬投資理財的報案:一男子出資 300 余萬委托某二級股票市場項目的投資者幫其代操作投資。在此期間,該投資者時常會分享“個股走勢”“賬戶收益”的圖片或視頻給劉先生,但到了雙方契約期滿時,劉先生卻討要投資收益及本金無果、還被要求續簽協議。

      經查,該投資者實則是一名失信人員,此前所提供大量“賬戶收益”圖片,均是通過 P 圖偽造的。

      AI技術的興起在許多領域極大地解放了人們的雙手,也帶來了新的安全隱患。圖像信息的造假是最常見的風險之一,AI圖像內容安全也成為了圖像圖形領域關注的重點。

      近日,中國圖象圖形大會(CCIG 2023)在蘇州舉辦,大會以“圖象圖形向未來”為主題,譚鐵牛、趙沁平、吳一戎、徐宗本等院士出席現場并作主旨報告。

      其中,譚鐵牛院士就《視覺內容生成與安全》進行主題報告分享,從人工智能內容生成的研究背景及現狀出發,介紹了近年來在內容生成和取證方面取得的研究結果,就視覺鑒偽技術要點進行專門分享,并展望了未來的發展趨勢。

      譚鐵牛提到,以大模型為代表的人工智能核心技術取得了新的突破,人工智能的廣泛應用也給人類社會帶來法律法規、道德倫理、社會治理等方面的挑戰。AIGC能夠讓“眼見能不為實,眼見不再為實”,內容生成與內容安全要統籌兼顧。

      或許有人存在“幸存者偏差”的心態,認為自己并不屬于AIGC“換臉”魔法的輻射對象,圖像安全與自己無關。事實上,除了人像,人們在工作中常見常用的各類文檔所產生的圖片,也是造假重災區,如被篡改的資質證書、文案、聊天截圖等,常常被用于散播謠言、經濟詐騙,開頭提到的理財詐騙使用的便是圖片篡改手段。

      CCIG 2023舉辦期間,《文檔圖像智能分析與處理》高峰論壇引發了眾多業內人士的關注。該論壇由中國圖象圖形學學會文檔圖像分析與識別專業委員會與合合信息聯合組織,由中國圖象圖形學學會常務理事、華南理工大學的金連文教授擔任主持人。

      金連文主持《文檔圖像智能分析與處理》論壇

      論壇邀請到了相關領域最頂尖的研究者們,包括中科院自動化所、北大、中科大的學術專家,以及華為等知名企業的技術代表,就文檔圖像處理技術的發展現狀及應用,AI圖像內容安全面臨的挑戰、多模態大模型時代的行業機遇等議題展開了深入討論。

      1、文檔處理智能化之路:

      緣起百年之前,AI引發劇變

      文檔就是各種合同嗎?其實不然,文檔涵蓋的載體遠比常人想象的寬泛,如紙張、物理表面、圖像、文件等含有文字符號的媒體都屬于文檔。近年來,隨著數字化轉型提速,AI 在文檔智能處理領域的落地,令許多原本手工化的文檔處理環節登上了效率“直升梯”。

      有關文檔識別處理的研究始于百年之前。1929 年,德國學者 Tausheck 通過純光學技術研究,提出了首個 OCR 專利“光學字符識別”,此后OCR相關技術不斷發展,并被廣泛應用于文檔處理中。2013年前后,隨著深度學習技術的引入,文檔識別與理解技術也就此邁向以深度學習為主導的研究時期,Attention 機制等深度學習技術在文檔圖像處理領域的應用,使得文檔識別性能也得到了快速提升。

      引用自劉成林《大模型時代的文檔識別與理解》報告主題分享

      什么樣的文檔處理稱得上是“智能文檔處理”呢?從使用者的角度看,“智能”至少需要滿足自動從不同文檔中提取有效信息這個基礎,甚至達到“理解”文檔信息,輔助人們辦公、生活的層級。

      在《文檔圖像智能分析與處理》論壇上,專家們從框架上劃定了“智能文檔處理”的技術范疇,包括文檔圖像分析與預處理、文檔解析與識別、版面分析與還原、文檔信息抽取與理解、AI安全、知識化等?梢园l現,關于文檔圖像的工作處于整個流程的第一環節,對文檔處理后續工作地質量與效率有著決定性的影響。

      2、圖像預處理:

      文檔智能化處理的重要開端

      進入實際應用后,文檔圖像處理還面臨著諸多挑戰。文檔類型多樣化、產生了繁雜的版式與結構;受拍攝器材、背景環境等外部因素的影響,圖像時常存在噪聲和質量問題;圖文信息中的形變、陰影、摩爾紋等情況,也加大了技術識別和理解工作的難度。

      劉成林就《人工智能大模型時代的文檔識別與理解》報告主題進行分享

      論壇中,中國科學院自動化研究所副所長劉成林認為,總體上,當前文檔識別與理解研究向深度、廣度擴展,處理方法全面轉向深度神經網絡模型和深度學習方法,識別性能大幅提升且應用場景不斷擴展。但當前技術在識別精度和可靠性、可解釋性、自適應性等方面存在明顯不足,還有形變解決、跨場景能力薄弱等很多技術問題有待解決。

      劉成林專門提到,文檔圖像預處理等領域目前有很大的進展,挑戰也很多。這一觀點也引起了產業界專家的共鳴。合合信息智能技術平臺事業部副總經理、高級工程師丁凱博士就合合信息在文檔圖像預處理方面的工作進行了分享。

      丁凱指出,文檔圖像預處理的整體架構由 ROI 提取、干擾去除、形變矯正、圖像恢復、圖像增強這五個重要技術步驟組成。其中,形變矯正包括了對傾斜透視、彎曲的矯正,圖像恢復可用于解決陰影、摩爾紋干擾信息對圖像識別影響的問題。

      舉個例子,當人們用手機拍攝下一本書的某個頁面時,受拍攝角度、文檔放置位置、抖動等因素的影響,可能會造成所拍攝的圖像有折疊彎曲的現象,需要進行矯正處理。合合信息采用基于位移場網絡學習方法的系統構架,可對形變文檔進行智能矯正,包括彎曲矯正與透視矯正,同時智能定位文檔邊緣,切除多余背景,自動“拉平”圖像,提升文檔內容識別效率與質量。

      另外,涉及有些不便導出的文件、圖片時,人們需要對著電腦屏幕拍照,可能產生嚴重的“摩爾紋”(屏幕紋),從而加大了識別和理解工作的難度,導致模型在處理文檔圖像時,出現識別精度差、分析結果不正確等情況。

      因此,如果要對摩爾紋進行去除,首先需要從文檔背景中提取一個模塊,將圖像中的摩爾紋等干擾項進行提取,借助干擾去除模塊對摩爾紋進行消除后,再把原圖和去除干擾項的圖進行融合,從而就能獲得一張效果比較好的摩爾紋去除圖。

      合合信息通過對文檔進行智能圖像處理,可大幅提升文檔掃描質量、文檔識別分析能力。目前,彎曲矯正、去摩爾紋、反光消除等多項技術已被應用于合合信息旗下“掃描全能王”等產品中。

      如果說圖像的預處理能力影響的是文檔處理的效率,那么對于圖片中虛假信息的辨別,則關乎到使用者的安全和利益。面對文檔篡改、虛擬圖像識別等新的問題,AI 仍然是重要的突破口。

      3、保障文檔圖像安全

      研究者做了這些工作

      一般情況下,篡改文本圖像的生成與檢測問題往往被認為是對立的。但在中國科技大學的謝洪濤教授看來,二者其實一個矛與盾的問題,密不可分、相輔相成。

      謝洪濤認為,篡改文本圖像的生成方法能夠反映篡改文本圖像檢測方法的檢測性能;同時,篡改文本圖像檢測方法也能反映篡改文本圖像生成的效果,因此兩者只有共同進步才能實現矛與盾的良性發展。

      引用自謝洪濤《篡改文本圖像的生成與檢測》報告主題分享

      在過往的一些訓練方法中,針對不同的偽造方法所得到的檢測模型可能并不具備泛化性,為了構建一個通用的篡改文本檢測器,如何做到既保留場景文本檢測器的優越性、并降低對數據量的依賴程度就十分重要。

      謝洪濤提到,篡改文本檢測定義為多分類目標檢測任務,任務的檢測不應只擬合篡改文本區域,因此他們提出,通用檢測器的構建應該從一般場景文本向篡改文本檢測器的網絡修改策略,并基于頻域的特征提取器來降低網絡對數據量的依賴性。

      而通過引入頻域或者其他域中對模型檢測的生成內容進行特征感知,包括偽造區域的紋理區分、設計合理的偽造檢測算法、時間復雜度等等,可最終建立起一個攻防博弈的過程。

      謝洪濤就《篡改文本圖像的生成與檢測》報告主題進行分享

      產業應用中,面對文檔圖像內容的安全問題,合合信息也進行了相應的部署,在其智能文字識別服務平臺推出了篡改檢測服務。

      據合合信息丁凱博士介紹,過去技術人員通常會參考Exif信息來判斷圖片是否存在篡改主要問題,但這種方法容易出現誤判:圖片經過PS,GMIP等圖像編輯軟件,但未篡改具體內容,可能會誤判;圖片被篡改后,用第三方軟件或工具抹除Exif信息,也可能造成誤判。

      基于此,合合信息研發了基于深度學習的圖像篡改檢測技術及相關系統,融合SRM、BayarConv、ELA等方法提升 CNN Tamper Detector 性能,檢測 RGB 域和噪聲域存在痕跡的篡改。

      丁凱就《智能文檔處理技術在工業界的應用與挑戰》報告主題進行分享

      通過學習圖像被篡改后統計特征的變化,該系統智能捕捉圖像在篡改過程中留下的細微痕跡,可檢測出擦除重打印文本、重打印文本、復制、移動、拼接等多種篡改形式,讓人工智能準確識別出圖片篡改的不同類型,并進行針對性的處理,提升識別精度和場景通用性。目前,合合信息圖像篡改檢測技術已被銀行、保險、制造業等多個行業引入。

      4、模態大模型時代

      智能文檔處理的挑戰與機遇

      近半年來,大模型成為智能時代全新的基礎設施。對于大模型的討論,關注者們不應當只停留在用了多少張卡、龐大的參數量和增加了哪些新模態,而是 AI 的能力如何應用到具體的產業中,比如借助大模型,讓文檔圖像智能分析與處理可以更好地處理跨模態信息,將文本、視頻、圖片等不同形式的信息進行融合,從而實現更加全面、深入的信息分析。

      作為圖像圖形技術的重要應用場景之一,文檔圖像智能處理也應當積極擁抱大模型時代。北京大學教授鄒月嫻在論壇現場中提到,“在與文檔圖像處理技術密切相關的OCR領域中,專業化大規模的預訓練模型是可行的。大模型是一個大的趨勢,對于小團隊來說,做工具是一個非常好的方法。”

      鄒月嫻就《視覺-語言預訓練模型及遷移學習方法》報告主題進行分享

      深入產業 AI,不可避免地會遇到更低頻、長尾的復雜場景和大規模協同的需求。這些具體場景的數據樣本少、數據分布不均,這也意味著企業在研發上也需要更高的成本,服務定制化程度也更高,通用性大模型的優勢由此顯現。

      在文檔圖像處理領域中,處于應用層的企業用戶往往要面臨復雜多樣的場景,這意味著企業需要調用多個 API,維護成本大、難度也較高。因此,企業更需要的是一個能覆蓋多元使用場景、具備專業行業 Know-How 的垂直領域 OCR 大模型。

      一個理想的設想是,企業既可以調用 OCR 大模型全部能力,也可以結合自身企業需求和特定場景,基于小型知識圖譜訓練自己的模型算法。對此,華為云 AI算法研究員廖明輝提出,垂直領域OCR大模型在數據層面,最關鍵的不是數據的數量,而是數據的多樣性。

      廖明輝就《華為云OCR技術進展及實踐》報告主題進行分享

      以銀行中常見的基金對賬單托管業務為例,市面上基金公司眾多,往往每家公司的賬單樣式都不相同,加上復雜的表格呈現形式,因此十分考驗 OCR 大模型對結構化信息的提取能力;贠CR大模型之上,銀行就可以針對托管對賬單這一特定場景的結構化信息特性,訓練專用的提取算法。

      這種基于垂直領域的大模型對專業知識數據的需求更高,丁凱也表示,很多算法可能在某一個數據集中表現很好,但換一個效果就大打折扣。因此,如何通過零樣本、小樣本等進行技術創新也是一個值得探索的點,“思考 OCR 領域的智能涌現是什么很重要。”丁凱說。

      劉成林也對OCR大模型做了一下系統性的總結,指出:大模型的特征表示、語言能力對于文檔處理的智能化發展非常關鍵。大模型技術與光學字符識別(OCR)技術的結合,能夠對海量數據進行理解、處理;不同任務的專用模型和學習算法,接下來仍然大有可為。

      “大模型的可解釋性、安全度十分重要,還需要研究者們進行更為深入的探討。具體到實踐層面,大模型技術還有可觀的提升空間。”劉成林提到,從識別性能來看,大模型技術在場景文本、邏輯版面、文檔問答等方面還有很多工作可以做。

      今天,大模型的準入門檻正在不斷降低,技術變革正在席卷更多的行業,為文檔圖像智能處理帶來了新的機遇,一場關于耐力和實力的馬拉松較量已拉開序幕。

      參考資料(以下均為大會報告):

      《人工智能大模型時代的文檔識別與理解》.劉成林

      《視覺-語言預訓練模型及遷移學習方法》.鄒月嫻

      《篡改文本圖像的生成與檢測》.謝洪濤

      《華為云OCR技術進展及實踐》.廖明輝

      《智能文檔處理技術在工業界的應用與挑戰》.丁凱

      文章內容僅供閱讀,不構成投資建議,請謹慎對待。投資者據此操作,風險自擔。

    海報生成中...

    [No.S013]

    最新新聞

    熱門新聞

    即時

    全球頂級AI創作社區回歸!海藝AI國內首發“全民娛樂化創作

    海藝AI的模型系統在國際市場上廣受好評,目前站內累計模型數超過80萬個,涵蓋寫實、二次元、插畫、設計、攝影、風格化圖像等多類型應用場景,基本覆蓋所有主流創作風格。

    新聞

    市場占比高達35.8%,阿里云引領中國AI云增長

    9月9日,國際權威市場調研機構英富曼(Omdia)發布了《中國AI云市場,1H25》報告。中國AI云市場阿里云占比8%位列第一。

    企業IT

    華為坤靈發布IdeaHub千行百業體驗官計劃,助力中小企

    9月24日,華為坤靈召開“智能體驗,一屏到位”華為IdeaHub千行百業體驗官計劃發布會。

    3C消費

    雅馬哈推出兩款高端頭戴耳機YH-4000與YH-C3000

    雅馬哈昨日宣布推出兩款頭戴式耳機,分別是平板振膜的YH-4000和動圈原理的YH-C3000。

    研究

    IDC:2025上半年全球智能家居清潔機器人出貨量同比暴

    IDC今日發布的《全球智能家居清潔機器人設備市場季度跟蹤報告,2025年第二季度》顯示,上半年全球智能家居清潔機器人市場出貨1,2萬臺,同比增長33%,顯示出品類強勁的市場需求。

    国产日韩精品一区二区_欧美一级片在线播放_久久精品中文字幕电影_久久视频精品在线_亚洲国产成人久久综合一区_久久精品国产精品_国产视频精品免费播放_在线视频中文亚洲_亚洲午夜未满十八勿入免费观看全集_精品亚洲一区二区_国产原创欧美精品_国产色综合天天综合网_九九久久国产精品_欧美极品少妇xxxxⅹ裸体艺术_亚洲国产精品人人爽夜夜爽_尤物九九久久国产精品的分类
    色综合天天狠天天透天天伊人| 夜夜嗨av一区二区三区网站四季av| 免费a级毛片在线播放| 日韩最新在线视频| 国产成人免费视频一区| 国产成人手机高清在线观看网站| 午夜av成人| 国产成+人+综合+亚洲欧美丁香花| 亚洲少妇诱惑| 国产风韵犹存在线视精品| 日韩欧美aaa| 一区在线观看视频| 亚洲大型综合色站| 久久久精品视频成人| 久久久久久艹| 欧美成人aaa| 999av小视频在线| 亚洲资源在线观看| 欧美午夜一区| 亚洲欧美日韩一区二区在线| 国产伦精品一区二区三区视频孕妇| 三级欧美日韩| 狠狠狠色丁香婷婷综合激情| 国产啊啊啊视频在线观看| 天天综合色天天综合色hd| 最近2019中文字幕第三页视频| 国产欧美高清视频在线| 黄色美女视频在线观看| 一个色综合导航| yw193.com尤物在线| 欧美国产日韩中文字幕在线| 欧美二区视频| 久久久久国产精品一区三寸| yiren22亚洲综合伊人22| 国产精品久久久久久av福利| 欧美丰满嫩嫩电影| 亚洲国内自拍| 国产真实乱对白精彩久久| 久久艹在线视频| 国产喂奶挤奶一区二区三区| 日韩精品免费在线播放| 国产精品成人一区二区三区夜夜夜| 国产电影一区二区三区| 国产美女在线观看| 亚洲国产欧美一区二区三区不卡| 在线亚洲欧美视频| 国产精品色眯眯| 悠悠资源网久久精品| 91视频在线免费观看| 奇米成人av国产一区二区三区| 亚洲日本丝袜连裤袜办公室| 精品亚洲国产视频| 欧美一区国产二区| 日韩美女av在线| 色天使综合视频| 欧美三电影在线| 国模视频一区二区三区| 精品国产91亚洲一区二区三区www| 日韩在线观看一区| 天堂社区 天堂综合网 天堂资源最新版| 思思99re6国产在线播放| 久久精品国产免费| 91精品国产欧美日韩| 欧美体内谢she精2性欧美| 精品国产123区| 亚洲最新中文字幕| 国产精品日本| 91成人免费视频| 亚洲午夜在线| 成年永久一区二区三区免费视频| 亚洲天堂av老司机| 欧美一级专区| 亚州av乱码久久精品蜜桃| 亚洲人体偷拍| 性高湖久久久久久久久| 在线播放日韩专区| 国产精品久久久久999| 偷拍精品福利视频导航| 一区二区三区动漫| 黄色成人在线| 欧美三区免费完整视频在线观看| 综合久久五月天| 欧美国产成人精品| 国产亚洲欧美另类中文| 国产一区二区精品久久99| 亚洲欧洲一区二区天堂久久| 99精品国产在热久久下载| 成人xxxxx| 亚洲永久免费| 日韩在线三级| 日韩电视剧在线观看免费网站| 精品视频123区在线观看| 2020国产精品久久精品不卡| 欧美激情视频一区二区三区不卡| 欧美国产精品| 97精品在线观看| 久久久久久久久丰满| 久久久久久影视| 久久亚洲一区二区三区四区| 日韩精品在线观看一区| 米奇777在线欧美播放| 在线国产亚洲欧美| 2021国产精品久久精品| 一本大道亚洲视频| 成人直播在线观看| 91精品91久久久中77777| 色菇凉天天综合网| 午夜精品久久久久久99热| 丁香婷婷综合五月| xxx欧美精品| 最近日韩中文字幕中文| 1000部国产精品成人观看| 国产精品视频26uuu| 97久久中文字幕| 羞羞影院欧美| 一区二区网站| 沈樵精品国产成av片| 欧美欧美在线| 国产精品一区二区av交换| 欧美天天综合| 色一情一乱一伦一区二区三区丨| 91欧美精品午夜性色福利在线| 免费av网站在线观看| 欧美三级午夜理伦三级中文幕| 亚洲成年人网站在线观看| yiren22综合网成人| 国产一区二区三区在线观看免费| 欧美一级网站| 成人自拍网站| 美女一区二区视频| 怡红院av在线| 亚洲国产精品成人一区二区| 国产91在线高潮白浆在线观看| 黄色亚洲大片免费在线观看| 精品福利在线看| 国产精品一区久久久久| 91嫩草国产在线观看| 丰满岳妇乱一区二区三区| av网站在线免费看推荐| 国产精品高清在线| 欧美一区二区高清| 精品一区二区三区影院在线午夜| 精品成人在线视频| 9191国语精品高清在线| 一个色综合导航| 色8久久精品久久久久久蜜| 欧美激情1区2区| 91精品国产一区二区| 成人综合av网| 日韩欧美在线不卡| 国产精品免费久久久久久| 日韩精品中文字幕一区二区| 亚洲成av人片一区二区| 松下纱荣子在线观看| 日韩影院二区| 香蕉久久夜色精品国产| 日韩欧美福利视频| 欧美日韩精品欧美日韩精品一综合| 国精品**一区二区三区在线蜜桃| 日韩黄色大片网站| 亚洲黄色一区二区三区| 国产亚洲美女精品久久久| 国产精品扒开腿做爽爽爽视频软件| 精品理论电影在线|