產品介紹
隨著計算機技術的發展,各行各業都開始采用計算機及相應的信息技術進行管理和運營,這使得企業生成、收集、存貯和處理數據的能力大大提高,數據量與日俱增。企業數據實際上是企業的經驗積累,當其積累到 程度時,必然會反映出規律性的東西;所以對企業來說,這些堆積如山的數據無異于一個巨大的寶庫。除此之外,互聯網的發展更是為我們帶來了海量的數據和信息。在缺乏強有力的工具的情況下,這些海量的數據已經遠遠的超出了人的理解和概括的能力。在這樣的背景下,人們迫切需要新一代的計算技術和工具來開采數據庫中蘊藏的寶藏,使其成為有用的知識。在市場需求和技術基礎這兩個因素都具備的環境下,數據挖掘(Data?Mining)的概念與技術就應運而生了。
數據挖掘技術未來的發展方向和研究焦點是對各種非結構化數據的挖掘,如對文本數據、空間數據、圖形數據、視頻圖像數據進行挖掘,處理的數據 會涉及到更多的數據類型,它們更復雜,結構更 。
北京理工大學大數據搜索與挖掘實驗室張華平主任研發的NLPIR大數據語義智能分析技術是滿足大數據挖掘對語法、詞法和語義的綜合應用。NLPIR大數據語義智能分析平臺是根據中文數據挖掘的綜合需求,融合了網絡采集、自然語言理解、文本挖掘和語義搜索的研究成果,并針對互聯網內容處理的全技術鏈條的共享開發平臺。
NLPIR大數據語義智能分析平臺主要有采集、文檔轉化、新詞發現、批量分詞、語言統計、文本聚類、文本分類、摘要實體、智能過濾、情感分析、文檔去重、全文檢索、編碼轉換等十余項功能模塊,平臺提供了客戶端工具,云服務與二次開發接口等多種產品使用形式。各個中間件API可以無縫地融合到客戶的各類復雜應用系統之中,可兼容Windows,Linux, Android,Maemo5, FreeBSD等不同操作系統平臺,可以供Java,Python,C,C#等各類開發語言使用。
數據挖掘技術及其應用是目前 上的一個研究熱點,并在許多行業中得到了很好的應用,尤其是在市場營銷中獲得了成功,初步體現了其優越性和發展潛力。在信息管理領域,綜合應用數據挖掘技術和人工智能技術,獲取用戶知識、文獻知識等各類知識,將是實現知識檢索和知識管理發展的必經之路。