當前位置: 服務信息>> 科普
 
少數民族文字文檔識別系統問世
中央政府門戶網站 www.gov.cn   2006年06月21日   來源:新疆日報

    新疆大學信息工程學院副教授哈力木拉提·買買提經過10年苦心研究,終於研發出“維哈柯(漢英)阿(英)雙向印刷文檔識別系統”。該項目已通過教育部科技成果鑒定,在國內外首次解決了實用多字體維、哈、柯(英漢混排)雙向文檔的識別,提高了阿拉伯文(英)雙向文檔的識別率。該系統的主要技術指標達到了國際領先水平。不久前,在北京召開的2006年中國電子信息創新技術年會上,該項目獲得二等獎,並申報了國家科技成果獎。

    “維哈柯(漢英)阿(英)雙向印刷文檔識別系統”是由新疆大學與清華大學共同合作研發的。作為該項目維哈柯部分的主持人哈力木拉提,攻克了維吾爾文、哈薩克文及柯爾克孜文的印刷出版物經掃描圖像識別輸入計算機的難題,實現了維、哈、柯文與漢文、英文混排文檔的識別以及阿拉伯文與英文混排文檔的識別。6月16日,哈力木拉提向記者演示了這一系統。一份10頁的維吾爾文的資料,放入掃描儀後,用鼠標點擊該系統後,不到1分鐘,這份資料就經掃描錄入電腦形成了電子文檔。哈力木拉提又拿出了一份2頁內有漢文、英文、維吾爾文的文字資料,僅僅幾秒鐘,這份資料就經掃描錄入電腦形成了電子文檔。隨後,操作者便能自如地對這些電子文檔進行編輯處理。

    哈力木拉提介紹説,該系統最大的特點是能準確、高效地將維、哈、柯、阿文的多種語言混排的印刷出版物,如報紙、雜誌、辭典、教科書等轉化為電子文檔,建立電子圖書,極大地便利文字資料的信息化處理。

    “維哈柯(漢英)阿(英)雙向印刷文檔識別系統”的軟體尚未上市,目前,該系統正在加密包裝階段,為即將上市做準備。 (記者 興科、張芳)