天堂色网-天堂色综合-天堂社区在线观看-天堂社区在线视频-天天操网-天天操网站

 
當(dāng)前位置: 首頁 » 行業(yè)資訊 » 機(jī)器人»以識(shí)別西夏文為例,聊聊人工智能如何幫我們認(rèn)識(shí)歷史
   

以識(shí)別西夏文為例,聊聊人工智能如何幫我們認(rèn)識(shí)歷史

 46.1K
     [點(diǎn)擊復(fù)制]
放大字體  縮小字體 發(fā)布日期:2017-10-27   瀏覽次數(shù):1010
核心提示:  曾記得有一次聊天,有個(gè)同伙描寫他對(duì)人工智能的印象,總結(jié)成三個(gè)詞:東方的、貿(mào)易的、將來的。  我立即表現(xiàn)你說的很好,獨(dú)一的成績是一條都沒說對(duì)  按下我們倆怎樣睜開斗毆暫且不提。這里愿望廢除的是年夜家

  曾記得有一次聊天,有個(gè)同伙描寫他對(duì)人工智能的印象,總結(jié)成三個(gè)詞:東方的、貿(mào)易的、將來的。

  我立即表現(xiàn)你說的很好,獨(dú)一的成績是一條都沒說對(duì)……

  按下我們倆怎樣睜開斗毆暫且不提。這里愿望廢除的是年夜家對(duì)人工智能的某種固有印象。現(xiàn)實(shí)上,人工智能作為一種很早就成長起來的通用技巧,毫不是東方的專利,也毫不僅僅可以或許發(fā)明貿(mào)易價(jià)值。

  乃至在某些機(jī)緣偶合下,人工智能可以或許成為我們用以熟悉汗青、熟悉本身平易近族、熟悉先人與曩昔的利器。

  梁啟超說“學(xué)術(shù)乃世界之公器”,不只是說學(xué)術(shù)世界人共有,同時(shí)也是說學(xué)術(shù)世界共致。作為一種基本對(duì)象的人工智能,常常可以或許在乎想不到處所產(chǎn)生功效。好比說明天為年夜家引見的借助人工智能技巧,主動(dòng)辨認(rèn)西夏文——一個(gè)純潔中國的人文社科范疇。

以識(shí)別西夏文為例,聊聊人工智能如何幫我們認(rèn)識(shí)歷史

  (美感獨(dú)特的西夏文)

  固然這項(xiàng)技巧年夜多半人永久不會(huì)涉足,但這個(gè)案例的價(jià)值在于可以打破我們對(duì)AI的某些成見。AI不只是集中在那幾個(gè)范疇,也不是歐美寡頭的玩具,它乃至能夠無處不在。

  為何要辨認(rèn)西夏文?個(gè)中隱含著哪些艱苦?

  我們曉得,西夏是與北宋、遼、金前后對(duì)立的黨項(xiàng)族國度,已經(jīng)統(tǒng)治河西地域跨越二百年。與年夜眾認(rèn)知中分歧,西夏不是個(gè)茹毛飲血的蠻橫文明。他們已經(jīng)創(chuàng)建過驚人的文明、藝術(shù)與宗教文明,但跟著1227年蒙古滅西夏,蒙元不為西夏立史,關(guān)于這個(gè)政權(quán)的記載疾速滅亡,李元昊立國時(shí)創(chuàng)建的西夏文也隨之湮滅。

  西夏文別名河西字、番文、唐古特文,曾在西夏王朝總攬的今寧夏、甘肅、陜東南部、內(nèi)蒙古南部地域風(fēng)行了約兩個(gè)世紀(jì)。但在西夏滅國后,這類參考漢字創(chuàng)建的獨(dú)特文字逐步掉傳,終究成了一種逝世文字。

  直到1804年,武威年夜云寺發(fā)明了有名的《重建涼州護(hù)國寺感通塔碑》,西夏文才在埋藏了數(shù)百年后重現(xiàn)人世。從此識(shí)讀西夏文開端成了學(xué)界的主要任務(wù)。

以識(shí)別西夏文為例,聊聊人工智能如何幫我們認(rèn)識(shí)歷史

  (《重建涼州護(hù)國寺感通塔碑》部分)

  二百年以來,出土的西夏文文獻(xiàn)賡續(xù)增多,個(gè)中年夜部門都被英、俄探險(xiǎn)家?guī)У搅司惩狻5袊鴮W(xué)者盡力下,西夏文的基本文字辨認(rèn)曾經(jīng)完成,現(xiàn)階段的任務(wù)重點(diǎn)是根據(jù)文字列表,去識(shí)讀年夜量西夏文文獻(xiàn)的詳細(xì)內(nèi)容,揭開西夏和其時(shí)華夏、西域列國的汗青迷霧。

  但在這個(gè)進(jìn)程里,研討人員認(rèn)讀西夏文必需經(jīng)由過程手工翻閱查找,消耗時(shí)光異常辛勞不說,因?yàn)槲飨奈氖且环N類似度極高的文字,人工辨認(rèn)還能夠存在很年夜的毛病率。

  所以就有學(xué)者提出,應(yīng)用盤算機(jī)來主動(dòng)辨認(rèn)西夏文。這類假想很好,但在詳細(xì)操作中照樣有偉大成績。好比西夏文構(gòu)造龐雜、構(gòu)成字符各部門要素高度類似,而且均勻筆劃到達(dá)25畫,盤算機(jī)辨認(rèn)難以動(dòng)手。

  另外,西夏時(shí)代固然已有印刷術(shù),但出土文獻(xiàn)照樣以手手本和刻版文字為主,統(tǒng)一個(gè)字的在分歧文獻(xiàn)上的地位不固定、全體結(jié)構(gòu)會(huì)產(chǎn)生偏移,都給機(jī)械辨認(rèn)帶來偉大艱苦。

  因而成心思的事涌現(xiàn)了,寧夏年夜學(xué)相干研討機(jī)構(gòu)為代表的學(xué)術(shù)力氣,選擇了以人工智能技巧處理西夏文的主動(dòng)辨認(rèn)。

  而且這個(gè)任務(wù)很早就曾經(jīng)開端,賡續(xù)有結(jié)果出現(xiàn)。從時(shí)光上看,毫不是趕這波AI熱的產(chǎn)品。

  人工智能完成西夏文主動(dòng)辨認(rèn)

  其實(shí),用盤算機(jī)技巧處置西夏文很早就曾經(jīng)開端。

  早在1996年,日本國立亞非說話文明研討所就制造了西夏文字庫和排版體系。1997 年中國粹者李范文和日本學(xué)者中島干起應(yīng)用該排版體系協(xié)作出書了《電腦處置西夏文〈雜字〉研討》。俄羅斯應(yīng)當(dāng)也都有西夏文數(shù)據(jù)化和盤算機(jī)處置的項(xiàng)目與研討結(jié)果。

  而應(yīng)用彈性收集、神經(jīng)收集、AI算法和深度進(jìn)修來辨認(rèn)西夏文,則是中國搶先完成的一個(gè)創(chuàng)舉。

以識(shí)別西夏文為例,聊聊人工智能如何幫我們認(rèn)識(shí)歷史

  (記載片《奧秘的西夏》創(chuàng)建文字片斷)

  用AI辨認(rèn)西夏文,重要依托的是盤算機(jī)字符辨認(rèn)( optical character recognition,OCR) 技巧,這類技巧上世紀(jì)60年月就成了人工智能研討的重要范疇之一。它的焦點(diǎn)技巧主意是基于人工智能運(yùn)算來辨認(rèn)文字符號(hào)的數(shù)字影象,并將其轉(zhuǎn)換為對(duì)應(yīng)的數(shù)字文本,到達(dá)可辨認(rèn)、可編纂、可轉(zhuǎn)化的目標(biāo)。

  OCR技巧今朝在許多范疇曾經(jīng)相當(dāng)做熟,好比我們常常用到的印刷文件文字提取。在OCR辨認(rèn)范疇,更多的運(yùn)用是手寫體內(nèi)容的精準(zhǔn)辨認(rèn),而應(yīng)用OCR辨認(rèn)考古文獻(xiàn)中的非普遍應(yīng)用文字卻根本處于空白。

  這里可以聯(lián)合論文簡略引見兩種AI辨認(rèn)西夏文的案例。

  好比在《基于彈性收集的西夏文辨認(rèn)》傍邊,研討人員應(yīng)用彈性收集技巧,將西夏文中的筆劃特點(diǎn)停止網(wǎng)格化提取。再統(tǒng)計(jì)像素點(diǎn)在每一個(gè)網(wǎng)格內(nèi)的幾率散布,構(gòu)成一種可讀取的特點(diǎn)模子。最初應(yīng)用文檔主題模子辦法對(duì)提取的特點(diǎn)降維處置,聯(lián)合數(shù)據(jù)庫對(duì)文獻(xiàn)停止辨認(rèn)。

  依據(jù)論文這類辦法實(shí)際,這類辦法均勻辨認(rèn)率可達(dá)87.99 %。

  再好比《基于Mean Shift算法的西夏文字筆形辨認(rèn)》,Mean Shift算法,即偏移均值向量,是機(jī)械進(jìn)修范疇的一種根本算法。其基本實(shí)際是應(yīng)用信息密度來完成聚類、圖象朋分、跟蹤義務(wù),可應(yīng)對(duì)類似但界線隱約的圖象處置運(yùn)用。應(yīng)用這類算法,研討人員將原始材料生成幾率統(tǒng)計(jì)直方圖,經(jīng)由過程類似度來斷定歸類詳細(xì)的西夏文筆形。

以識(shí)別西夏文為例,聊聊人工智能如何幫我們認(rèn)識(shí)歷史

  (西夏文智能辨認(rèn)算法流程)

  這里僅僅是兩個(gè)詳細(xì)運(yùn)用案例,應(yīng)用深度進(jìn)修等前沿人工智能技巧辨認(rèn)西夏文的運(yùn)用還在賡續(xù)成長。

  文獻(xiàn)與考古范疇的人工智能運(yùn)用

  能夠辨認(rèn)西夏文間隔我們的平常生涯還絕對(duì)較遠(yuǎn),但推行當(dāng)全部人文社科范疇,AI的運(yùn)用能夠就會(huì)從另外一個(gè)角度無窮切近我們的生涯。

  從近處來講,AI推進(jìn)學(xué)術(shù)效力,能夠會(huì)影響我們的學(xué)科設(shè)置裝備擺設(shè)、學(xué)術(shù)練習(xí)乃至高級(jí)教導(dǎo)系統(tǒng),從遠(yuǎn)處來看,AI推進(jìn)的進(jìn)一步辨認(rèn)汗青與文獻(xiàn)的才能,是我們窺測本身曩昔,懂得“中國”為什么是“中國”的全新對(duì)象。

  在我們沉溺于將來帶來的快感時(shí),人工智能卻能夠在汗青范疇疾速施展它的價(jià)值。經(jīng)由過程西夏文辨認(rèn)的例子,不難發(fā)明在文獻(xiàn)與考古這些社科范疇傍邊,人工智能至多可以施展以下幾種功能:

  1、考古圖象的辨認(rèn)與歸檔,好比基于算法的文物辨認(rèn)、文物數(shù)據(jù)化、考古現(xiàn)場數(shù)據(jù)化。

  2、文獻(xiàn)文本的辨認(rèn)與轉(zhuǎn)碼,好比原始文獻(xiàn)的文字辨認(rèn)讀取、文獻(xiàn)聚類、文獻(xiàn)數(shù)據(jù)化。

  3、文獻(xiàn)數(shù)據(jù)庫的常識(shí)圖譜化與機(jī)械進(jìn)修運(yùn)用。好比學(xué)科文獻(xiàn)圖譜化、時(shí)期文獻(xiàn)圖譜化、科研項(xiàng)目數(shù)據(jù)圖譜化,和基于常識(shí)圖譜練習(xí)的人文社科范疇智能體。這一點(diǎn)特別主要,想象力也最為充分。就像金融、翻譯等范疇極可能被AI替換一樣,文獻(xiàn)學(xué)與汗青研討范疇年夜部門依附考據(jù)、校勘、材料爬梳的任務(wù),也完整可以被AI代替。

  相似的人文范疇與AI跨界還有許多,有些乃至觸及哲學(xué)與倫理層面的技巧與人文互搏,今后我們會(huì)陸續(xù)引見。

  或許AI就像風(fēng),當(dāng)它是一場風(fēng)暴的時(shí)刻,家家戶戶都邑門窗緊鎖當(dāng)心防護(hù)。但當(dāng)它是清風(fēng)徐來穿屋而過的時(shí)刻,在我們不知覺間,AI就曾經(jīng)無孔不入了。

只要你關(guān)注機(jī)器人,你就無法錯(cuò)過睿慕課

 
 
 
[ 行業(yè)資訊搜索 ]  [ 加入收藏 ]  [ 告訴好友 ]  [ 打印本文 ]  [ 關(guān)閉窗口 ]
 
 
展會(huì)更多+
視頻更多+
點(diǎn)擊排行
 
主站蜘蛛池模板: 在线香蕉 | 午夜剧 | 国产综合在线观看视频 | 亚洲色图欧美在线 | 成人手机在线视频 | 成人a网站 | 黄色片视频免费观看 | 天天干天天色综合 | 欧美亚洲另类色国产综合 | 亚洲人成人77777网站不卡 | 成人免费观看视频 | 色综合天天综合网国产成人网 | 三级网址在线 | 国产大片中文字幕 | 最近中文字幕免费6 | 毛片黄 | 动漫视频成人无h码在线观看 | 欧美视频在线免费 | 黄色影院在线观看 | 成人爱视频 | 免费黄色一级毛片 | 婷婷开心激情 | 特级毛片永久久免费观看 | 欧美精品亚洲 | 亚洲欧美成人影院 | 久久久久国产精品免费免费 | 一区小说二区另类小说三区图 | 精品欧美中国福利第一导航 | 最新免费黄色网址 | 99精品视频看国产啪视频 | 亚洲综合精品一二三区在线 | 中国一级特黄高清免费的大片 | 亚洲日本va午夜中文字幕一区 | 一级毛片在线观看免费 | 超级色的网站观看在线 | 我的性放荡生活小说 | 妞干网免费在线观看 | 直接看的黄色网址 | 宠文肉细致高h一对一 | 高清不卡毛片 | 亚洲国产日韩欧美综合久久 |