<table id="iztqq"></table>
    1. <td id="iztqq"></td>

      <tr id="iztqq"><label id="iztqq"></label></tr>
        返回
        頂部
        我們已發送驗證鏈接到您的郵箱,請查收并驗證
        沒收到驗證郵件?請確認郵箱是否正確或 重新發送郵件
        確定

        智能語義技術在專利檢索中的應用

        機構
        小知2019-02-28
        智能語義技術在專利檢索中的應用

        智能語義技術在專利檢索中的應用

        #本文僅代表作者觀點,未經作者許可,禁止轉載,不代表IPRdaily立場#


        來源:IPRdaily中文網(iprdaily.cn)
        作者:隆天集團中專隆天知識產權運營(深圳)股份有限公司  周俊 高級項目經理、專利分析師
        原標題:智能語義技術在專利檢索中的應用


        摘要


        人工智能浪潮下,很多工作將會被替代。智能語義技術已經在專利檢索中大規模應用,未來將成為檢索專家的得力助手還是終結者?筆者基于其曾在專利審查工作中使用智能語義開展檢索的豐富經驗,通過梳理智能語義技術產生的原因、基本原理及其在專利檢索中的應用方式,給出了一個答案。


        專利檢索經歷了百余年的發展歷史,早在19世紀末美國政府就在咨詢工作中應用專利檢索技術,當時是針對紙質專利文獻的手工檢索。從20世紀70年代起,基于計算機的專利檢索逐步普及,專利檢索的效率也因此大幅提升,但對于當時的公眾而言,獲取專利信息仍然是十分困難的事情。直到1997年IBM開始在互聯網上提供專利信息服務,公眾獲取專利信息才變得相對容易[1] ??v觀專利檢索的發展歷史,伴隨著信息技術的變革,專利信息獲取和利用的方式也在不斷發生變化。


        進入21世紀以來,信息技術創新日益加快,人工智能技術的發展尤為迅速,網絡購物時的推薦算法、掃臉支付、語音助理等新技術已經不知不覺融入到我們的日常生活中。在專利檢索分析領域,被稱作智能語義的新技術也進入到了重要的發展時期。2018年5月,世界知識產權組織召開“知識產權局關于ICT戰略和人工智能”會議,會議資料顯示,多個國家和地區的知識產權局已經開始嘗試在專利審查的檢索環節應用智能語義技術 [2]。在商用專利數據庫領域,多款工具已經具備了智能語義檢索功能。新技術的出現為專利檢索工作帶來了什么樣的變化?作者基于其曾在專利審查工作中使用智能語義開展檢索的豐富經驗,簡要介紹智能語義技術產生的原因、基本原理及其在專利檢索中的應用方式。


        傳統檢索面臨的困境


        困境,不僅存在于專利檢索中,而是在于所有的傳統搜索領域。信息爆炸是困境的主要來源,隨著人類知識以幾何級數量增長,想要快速準確的搜索到所需信息并不是一件容易的事情。專利行業同樣面臨數據增長的問題,僅中國大陸公開的專利文獻數量,發明和實用新型專利文獻總量從2008年底只有不到250萬件,已經躍升到2018年底的1700萬余件,10年的時間增長了7倍,這為開展專利檢索工作帶來巨大的挑戰。


        基于傳統的布爾檢索方式,檢索專家們致力于在檢索全面性和檢索效率之間尋找平衡:任何一個技術概念都有諸多的表述方式,檢索時只有盡可能全面的列舉這些表述方式,才能保證不漏掉重要文獻;但每一種表述方式又會有多重含義,全面的表述將引入大量不準確的噪聲文件,這些噪聲文件浪費了檢索人員的瀏覽時間。如今,檢索專家們面對著增長了數十倍的專利文獻,感到越來越難在檢索的全面性與檢索效率之間找到平衡。


        智能語義檢索的興起


        為了解決傳統檢索面臨的困境,出現了一種自動擴展檢索內容的語義技術,具體來說是構建一個大型的同義詞庫,將用戶輸入的內容在同義詞庫中搜索,擴展相關關鍵詞來提高檢索的命中率。但是,這種語義技術雖然提高了檢索的全面性,但應用該算法會在每次檢索中命中更多的專利,同樣引入了噪聲文件,增加了檢索人員瀏覽和篩選文獻的工作量。


        另一種智能語義技術是基于語義相關性的排序。這種技術基于專利文本數據開展機器學習,自動運算詞語之間和文檔之間的相關性,基于相關性對文獻進行排序。這種方法的目標是將最相關技術排在最前,直接提升檢索人員瀏覽文獻的效率。應用該技術的專利檢索工具,可以允許用戶輸入任意長度的一段文本或是直接輸入一個專利公開號,系統將自動推薦最相關的文獻。


        智能語義技術在專利檢索中的應用


        對于基于同義詞庫的語義搜索技術,由于計算機僅僅是對用戶輸入的內容進行了擴展,在具體檢索時仍然執行了布爾檢索,因此這種語義檢索工具和傳統布爾檢索工具的差別不大,在理解和使用上沒有太大的困難。


        而基于潛在語義索引的搜索技術,則完全脫離了傳統布爾檢索的范疇,與我們長期對檢索的理解大不相同。這種搜索技術完全拋棄了從一個文獻集中限定出子集的過程,而是按照用戶所輸入文本內容的相關性,直接對一個文獻集進行排序。下面簡要介紹應用這種技術開展專利檢索的兩種方法。


        第一種方法是完全獨立使用智能語義檢索。此時檢索人員只需將想要檢索的一段文本輸入語義檢索系統,計算機就能根據用戶輸入的文本,對數據庫中存儲的千萬乃至上億條專利做排序,檢索人員依次瀏覽就可能獲得所需的專利。由于這種檢索方式不需要任何的檢索策略,完全沒有檢索經驗的人也能很快上手。對于檢索經驗豐富的人,在檢索初期也可以優先使用這種方法進行試探性檢索,有一定的幾率可以很快獲得滿意的結果,并且可以通過統計分析排序靠前的專利,發現更多的關鍵詞表述方式或相關的專利分類號。


        完全獨立使用智能語義檢索,雖然可以提升檢索的效率,但仍然不能替代檢索專家和布爾檢索。其中一個主要原因是:智能語義技術無法進行技術方案層面的理解,換句話說,智能語義技術還不能像檢索專家一樣,提煉出技術方案的核心技術特征開展精準檢索。例如針對下面的一段文本,檢索專家基于其中描述的技術方案和對現有技術的理解,會將“缺口”和“折彎部”這兩個特征作為核心特征來檢索,而目前的智能語義算法還無法模擬檢索專家從文本到技術方案這一抽象的思維過程。


        一種一體式自拍裝置,包括伸縮桿及用于夾持拍攝設備的夾持裝置,所述夾持裝置包括載物臺及設于載物臺上方的可拉伸夾緊機構,其特征在于:所述夾持裝置一體式轉動連接于所述伸縮桿的頂端,所述載物臺上設有一缺口,所述夾緊機構設有一與所述缺口位置相對應的折彎部,所述伸縮桿折疊后可容置于所述缺口及折彎部。


        使用智能語義最佳的方式是與專家布爾檢索結合使用。具體來說是利用布爾檢索式獲得檢索結果后,再利用一個與布爾檢索式無關的排序因子對上述檢索結果進行排序。布爾檢索式用于精準的表達技術方案的核心特征,智能語義將其他非核心特征用相關性來表述,用排序的方法展示給檢索專家。這樣檢索的好處是,一方面可以充分發揮檢索專家定義核心特征的作用,保證了檢索的精準度,同時發揮智能語義算法搜索的全面性,避免了因為對非核心技術特征的表述不夠全面而導致的漏檢。


        針對上面的例子,如果獨立使用布爾檢索,則至少要在檢索時限定出自拍裝置、夾持裝置、缺口、彎折部等特征,但將語義與布爾檢索結合時,可以僅用布爾檢索搜索缺口、彎折部等核心特征,再將該全部文本作為排序因子對檢索結果排序,就能將與自拍裝置、夾持高度相關的專利排序到最前。這種檢索方式既提高了檢索的準確性,又避免了漏掉重要專利,檢索的效率也能大幅提升。


        每當聽到人工智能將會取代某些工作時,相信不少人會有一絲擔憂。但筆者認為,專利檢索本身是一種目標高度不確定、需要大量主觀思考判斷和綜合分析的工作,檢索專家們完全不必把智能語義看作是競爭對手,而是當成今后工作中的重要工具為自己賦能。相信語義技術與專家布爾檢索的結合會是未來檢索的主流,基于海量數據模型的語義排序與基于布爾的精確命中,將會合奏出人與人工智能融合的完美樂章。



        注釋:

        [1]陳燕, 黃迎燕, 方建國. 專利信息采集與分析[M]. 清華大學出版社, 2006:104-106.
        [2]WIPO/IP/ITAI/GE/18,May 23 to May 25, 2018 (Geneva, Switzerland),https://www.wipo.int/meetings/en/details.jsp?meeting_id=46586.



        來源:IPRdaily中文網(iprdaily.cn)
        作者:隆天集團中專隆天知識產權運營(深圳)股份有限公司  周俊 高級項目經理、專利分析師
        編輯:IPRdaily趙珍          校對:IPRdaily縱橫君


        推薦閱讀(點擊圖文,閱讀全文)


        智能語義技術在專利檢索中的應用

        開年重磅!尋找40位40歲以下企業知識產權精英(40 Under 40)


        “投稿”請投郵箱“iprdaily@163.com”


        智能語義技術在專利檢索中的應用

        「關于IPRdaily」


        IPRdaily成立于2014年,是全球影響力的知識產權媒體+產業服務平臺,致力于連接全球知識產權人,用戶匯聚了中國、美國、德國、俄羅斯、以色列、澳大利亞、新加坡、日本、韓國等15個國家和地區的高科技公司、成長型科技企業IP高管、研發人員、法務、政府機構、律所、事務所、科研院校等全球近50多萬產業用戶(國內25萬+海外30萬);同時擁有近百萬條高質量的技術資源+專利資源,通過媒體構建全球知識產權資產信息第一入口。2016年獲啟賦資本領投和天使匯跟投的Pre-A輪融資。

        (英文官網:iprdaily.com  中文官網:iprdaily.cn) 

         

        本文來自IPRdaily.cn 中文網并經IPRdaily.cn中文網編輯。轉載此文章須經權利人同意,并附上出處與作者信息。文章不代表IPRdaily.cn立場,如若轉載,請注明出處:“http://www.meihaolucy.com/”

        本文來自于iprdaily,永久保存地址為/news_21073.html,發布時間為2019-02-28 08:37:17。
        我也說兩句
        還可以輸入140個字
        我要評論
        相關文章
        chinese少爷男男国产|精品福利一区二区|精品自拍现拍在线拍|香蕉大人芳草青青久久

          <table id="iztqq"></table>
        1. <td id="iztqq"></td>

          <tr id="iztqq"><label id="iztqq"></label></tr>