2構(gòu)建石油地質(zhì)領(lǐng)域本體
手工構(gòu)建本體是一項耗時耗力的巨大工程,自動化構(gòu)建本體技術(shù)尚不成熟[1,4],鑒于已有完善的《地質(zhì)敘詞表》和《石油主題詞表》,因而本文提出一種基于敘詞表的半自動化本體構(gòu)建方法,具體方法如圖2所示。地質(zhì)敘詞表又稱為地質(zhì)主題詞表,包含了地質(zhì)學(xué)科的詞匯和詞匯之間的各種關(guān)系。敘詞表的語義關(guān)系分為“用、代、分、屬、參”,分別用來表示詞匯之間的等同、等級、相關(guān)等語義關(guān)系。敘詞表包含較全面和權(quán)威的領(lǐng)域概念和重要的語義關(guān)系,為本體提供了較好的概念基礎(chǔ)。很多研究嘗試基于敘詞表進(jìn)行構(gòu)建本體,研究重點在于敘詞表向本體轉(zhuǎn)換的方法。由敘詞表構(gòu)建本體的方法將敘詞表的敘詞作為本體中概念的來源,在敘詞表概念關(guān)系的基礎(chǔ)上,修改完善概念的屬性、關(guān)系,并添加公理和函數(shù)。敘詞表的相關(guān)關(guān)系沒有更細(xì)的劃分,包含了本體一般定義中除了層次關(guān)系和等同關(guān)系外的所有關(guān)系。所以要想建立更精確的領(lǐng)域本體,除了敘詞的注釋,還需要參考其他知識來源,如《石油地質(zhì)》、《中國石油勘探開發(fā)百科全書》等,為本體的類添加需要的關(guān)系[4]。最終通過概念和概念層級的確定、定義概念的屬性、對漢語拼音、敘詞編號、英文譯名、范疇號、注釋項的處理及為概念添加實例等工作[5],構(gòu)建了輕量級的石油地質(zhì)領(lǐng)域本體,完成的面向知識服務(wù)的石油地質(zhì)領(lǐng)域本體包含18278個概念,概念之間的關(guān)系達(dá)到16487個,概念的實例4137個。關(guān)系分為等同關(guān)系、等級關(guān)系和相關(guān)關(guān)系,其中相關(guān)關(guān)系除包含敘詞表中固有的相關(guān)關(guān)系,還增加了相關(guān)領(lǐng)域?qū)W科,如信息技術(shù)及數(shù)學(xué)地質(zhì)。實例涵蓋了石油人物、書籍、機(jī)構(gòu)以及重點區(qū)域等,具體如圖3所示。
3石油地質(zhì)語義檢索原型系統(tǒng)設(shè)計與實現(xiàn)
3.1系統(tǒng)原型設(shè)計與實現(xiàn)
發(fā)表評論 |