澳门百家乐官方网站-百家乐官网风云论坛-澳门百家乐官网官方网站-百家乐博彩免费体验金3

清華主頁(yè) - 清華新聞 - 專(zhuān)題推薦 - 科技創(chuàng)新 - 正文

自主創(chuàng)新推動(dòng)智能圖文信息處理研究及產(chǎn)業(yè)化領(lǐng)先發(fā)展

——從國(guó)際領(lǐng)先、全面的文字識(shí)別到人臉筆跡生物特征認(rèn)證超越式突破

  信息時(shí)代中,利用計(jì)算機(jī)對(duì)浩如煙海的文檔、攝像資料實(shí)現(xiàn)基于內(nèi)容的檢索,迫切需要文字識(shí)別等智能化圖文信息處理技術(shù)。承載中華民族文化的文檔數(shù)字化和關(guān)系國(guó)家安全的身份認(rèn)證技術(shù)必須由中國(guó)人自己來(lái)完成。在國(guó)家“863”計(jì)劃和國(guó)家自然科學(xué)基金的長(zhǎng)期支持下,經(jīng)過(guò)二十余年的不懈努力,由清華大學(xué)電子工程系丁曉青教授帶領(lǐng)的研究組在漢字及多文種文字識(shí)別、多模式生物特征(人臉、筆跡等)身份認(rèn)證方面不斷取得了多項(xiàng)具有國(guó)際領(lǐng)先水平的自主創(chuàng)新研究成果,形成TH-OCR 系列文字識(shí)別軟件和TH-ID生物特征(人臉、筆跡等)認(rèn)證軟件產(chǎn)品,成功地進(jìn)行了產(chǎn)業(yè)化推廣應(yīng)用。榮獲國(guó)家科技進(jìn)步獎(jiǎng)二等獎(jiǎng)兩次(1999年、2003年)、三等獎(jiǎng)一次(1993年)。與多家國(guó)際知名公司開(kāi)展了技術(shù)授權(quán)和研究合作,包括微軟、 諾基亞、西門(mén)子、三星、IBM、Motorola、HP、Xerox (Scansoft)等。自主創(chuàng)新的重要科技成果包括:

  1. “TH-OCR高性能統(tǒng)一平臺(tái)上多文種文檔識(shí)別全信息數(shù)字化系統(tǒng)”

  該系統(tǒng)是解決多文種(簡(jiǎn)繁漢、日、韓/朝、英、藏、維吾爾、哈薩克、柯?tīng)柨俗巍⒗? 原文重現(xiàn)文檔全信息數(shù)字化規(guī)?;a(chǎn),及低質(zhì)、手寫(xiě)文檔和表格識(shí)別數(shù)據(jù)錄入的智能信息化工具。整體性能居于國(guó)際領(lǐng)先水平,系統(tǒng)主要內(nèi)容包括:

  1) 具有國(guó)際領(lǐng)先水平的高性能中日韓文字識(shí)別核心技術(shù),在自主提出模式識(shí)別統(tǒng)一熵理論的指導(dǎo)下,不僅提高了印刷及手寫(xiě)漢字識(shí)別的鑒別能力和實(shí)用適應(yīng)性,而且識(shí)別字符集空前擴(kuò)大,覆蓋了中日韓基本字符集。各種印刷字體的平均識(shí)別率在99.5%以上;脫機(jī)手寫(xiě)漢字識(shí)別率達(dá)98%。在國(guó)際競(jìng)標(biāo)中奪標(biāo),授權(quán)給微軟公司使用。

  2) 統(tǒng)一平臺(tái)上中華主要民族文字(混排漢英)文檔識(shí)別系統(tǒng)創(chuàng)新解決了印刷體藏、維吾爾、哈薩克、柯?tīng)柨俗挝募皣?guó)際上極為關(guān)注的阿拉伯文的識(shí)別難題。在多種分屬不同文字體系的民族文字字符識(shí)別、字符切分關(guān)鍵技術(shù)上取得了突破性的進(jìn)展;首次解決了常見(jiàn)的民族文字與漢字、英文混排文本的識(shí)別問(wèn)題;蒙古文識(shí)別研究也取得初步進(jìn)展。首次實(shí)現(xiàn)了統(tǒng)一平臺(tái)上多種民族文字的文檔識(shí)別系統(tǒng),已在中國(guó)西藏信息中心、民族出版社等民族地區(qū)單位推廣應(yīng)用,有利于推動(dòng)多元一體的中華民族文化信息化發(fā)展及與世界文化交流,有利于國(guó)家西部大開(kāi)發(fā)戰(zhàn)略實(shí)施。

  3) 在國(guó)內(nèi)外首次提出并研發(fā)成功自動(dòng)文檔全信息數(shù)字化系統(tǒng)。具有將復(fù)雜版面的報(bào)紙等文檔經(jīng)版面分析、識(shí)別、理解、最后自動(dòng)精確重構(gòu)為原式原樣的標(biāo)準(zhǔn)格式電子出版物等功能,“作為一個(gè)整體居于國(guó)際領(lǐng)先水平?!痹谖覈?guó)電子出版、數(shù)字圖書(shū)館工程等信息資源建設(shè)中發(fā)揮重要作用。

  4) 金稅工程增值稅發(fā)票識(shí)別防偽系統(tǒng)在全國(guó)推廣,極大打擊了偷漏說(shuō),切實(shí)保證金稅工程順利實(shí)施;銀行單據(jù)識(shí)別等行業(yè)應(yīng)用解決方案,為這些行業(yè)的信息化建設(shè)創(chuàng)造了條件。

  產(chǎn)品化成果廣泛應(yīng)用于辦公自動(dòng)化、銀行、稅務(wù)、公安各行業(yè)。THOCR2000、名片和身份證識(shí)別、郵政分揀等軟件,作為自主知識(shí)產(chǎn)權(quán)的主流軟件產(chǎn)品銷(xiāo)往海內(nèi)外。

  2. TH-ID多模生物特征(人臉、筆跡等)身份識(shí)別認(rèn)證系統(tǒng)

  讓計(jì)算機(jī)從“認(rèn)字”到“認(rèn)人”,利用人臉圖像、手寫(xiě)筆跡等生物特征進(jìn)行自動(dòng)身份識(shí)別認(rèn)證,可以代替?zhèn)鹘y(tǒng)的密碼、證件等方式,對(duì)于反恐斗爭(zhēng)和國(guó)家安全具有極其重要的作用。在多文種文字識(shí)別領(lǐng)域已有的長(zhǎng)期深厚模式識(shí)別研究經(jīng)驗(yàn)積累,為解決生物特征認(rèn)證難題提供了自主創(chuàng)新、跨越式突破發(fā)展的良好基礎(chǔ)。在國(guó)內(nèi)外首次推出的TH-ID多模生物特征(人臉筆跡簽字虹膜)身份識(shí)別認(rèn)證系統(tǒng)于2005年6月通過(guò)教育部組織的鑒定。該系統(tǒng)實(shí)現(xiàn)了在復(fù)雜背景下的圖像和視頻人臉自動(dòng)檢測(cè)、識(shí)別和認(rèn)證,實(shí)現(xiàn)了百萬(wàn)大數(shù)據(jù)庫(kù)的人臉查詢(xún)和主動(dòng)人臉身份認(rèn)證、基于單個(gè)漢字筆跡的識(shí)別和認(rèn)證、聯(lián)機(jī)手寫(xiě)簽字的身份認(rèn)證、虹膜身份識(shí)別和認(rèn)證、以及基于決策融合的多模生物特征身份識(shí)別認(rèn)證系統(tǒng)。TH-FaceID人臉識(shí)別系統(tǒng)在國(guó)際高水平人臉認(rèn)證競(jìng)賽(FAT2004)中以全部測(cè)試指標(biāo)均獲第一而獲得 “全面性能最佳成就獎(jiǎng)”,在2004年國(guó)家863人臉識(shí)別驗(yàn)證評(píng)測(cè)中各項(xiàng)指標(biāo)均獲第一。鑒定意見(jiàn)認(rèn)為:“TH-ID多模生物特征身份識(shí)別認(rèn)證系統(tǒng)在人臉、筆跡、簽字、虹膜的識(shí)別認(rèn)證技術(shù)上取得了重要進(jìn)展,該系統(tǒng)整體上達(dá)到了國(guó)際領(lǐng)先水平”。目前TH-ID系統(tǒng)已有若干重大成功應(yīng)用,最為突出的是TH-FaceID人臉認(rèn)證系統(tǒng)已應(yīng)用于深圳羅湖口岸的首次旅客自助通關(guān)系統(tǒng)上,自動(dòng)認(rèn)證通過(guò)率高達(dá)97%;筆跡鑒別系統(tǒng)已應(yīng)用于國(guó)家重要安全項(xiàng)目等。

  智能圖文信息處理研究及產(chǎn)業(yè)化領(lǐng)先發(fā)展,不僅具有自主創(chuàng)新的國(guó)際領(lǐng)先水平技術(shù),而且在產(chǎn)業(yè)化應(yīng)用推廣中與國(guó)家信息化建設(shè)需求結(jié)合,做出重要貢獻(xiàn),取得了可觀(guān)的經(jīng)濟(jì)效益和社會(huì)效益。目前,新開(kāi)辟的研究方向包括攝像文字識(shí)別、主動(dòng)式視頻監(jiān)測(cè)身份認(rèn)證等。(編輯 文清)

2006年01月13日 00:00:00

相關(guān)新聞

讀取內(nèi)容中,請(qǐng)等待...

最新動(dòng)態(tài)

清華大學(xué)新聞中心版權(quán)所有,清華大學(xué)新聞網(wǎng)編輯部維護(hù),電子信箱: [email protected]
Copyright 2001-2020 news.tsinghua.edu.cn. All rights reserved.