產(chǎn)品介紹
當(dāng)今,信息技術(shù)為人類步入智能社會開啟了大門,帶動了互聯(lián)網(wǎng)、物聯(lián)網(wǎng)、電子商務(wù)、現(xiàn)代物流、網(wǎng)絡(luò)金融等現(xiàn)代服務(wù)業(yè)發(fā)展,催生了車聯(lián)網(wǎng)、智能電網(wǎng)、新能源、智能交通、智能城市、 裝備制造等新興產(chǎn)業(yè)發(fā)展.現(xiàn)代信息技術(shù)正成為各行各業(yè)運(yùn)營和發(fā)展的引擎.但這個引擎正面臨著大數(shù)據(jù)這個巨大的考驗.各種業(yè)務(wù)數(shù)據(jù)正以幾何級數(shù)的形式爆發(fā),其格式、收集、儲存、檢索、分析、應(yīng)用等諸多問題,不再能以傳統(tǒng)的信息處理技術(shù)加以解決,對人類實現(xiàn)數(shù)字社會、網(wǎng)絡(luò)社會和智能社會帶來了障礙.大數(shù)據(jù)處理技術(shù)就應(yīng)用而生了。
大數(shù)據(jù)因為它所蘊(yùn)含的潛在價值,正在成為企業(yè)的隱形“金礦”.隨著生產(chǎn)、運(yùn)營、管理、監(jiān)控、銷售、客服等各個環(huán)節(jié)的數(shù)據(jù)不斷累積和增長,以及用戶數(shù)的不斷上升,通過從龐大的數(shù)據(jù)中分析出相關(guān)模式以及趨勢,可以實現(xiàn) 管理、準(zhǔn)確營銷,成為企業(yè)打開這一“金礦”的鑰匙.然而傳統(tǒng)的IT基礎(chǔ)架構(gòu)和數(shù)據(jù)管理分析方法已經(jīng)不能適應(yīng)大數(shù)據(jù)的快速增長.大數(shù)據(jù)的爆發(fā)是我們在信息化和社會發(fā)展中遇到的棘手問題,需要我們采用新的數(shù)據(jù)管理模式,研究和發(fā)展新一代的信息技術(shù)才能解決.
北京理工大學(xué)大數(shù)據(jù)搜索與挖掘?qū)嶒炇覐埲A平主任研發(fā)的NLPIR大數(shù)據(jù)語義智能分析技術(shù)是滿足大數(shù)據(jù)挖掘?qū)φZ法、詞法和語義的綜合應(yīng)用。NLPIR大數(shù)據(jù)語義智能分析平臺是根據(jù)中文數(shù)據(jù)挖掘的綜合需求,融合了網(wǎng)絡(luò)采集、自然語言理解、文本挖掘和語義搜索的研究成果,并針對互聯(lián)網(wǎng)內(nèi)容處理的全技術(shù)鏈條的共享開發(fā)平臺。
NLPIR大數(shù)據(jù)語義智能分析平臺主要有采集、文檔轉(zhuǎn)化、新詞發(fā)現(xiàn)、批量分詞、語言統(tǒng)計、文本聚類、文本分類、摘要實體、智能過濾、情感分析、文檔去重、全文檢索、編碼轉(zhuǎn)換等十余項功能模塊,平臺提供了客戶端工具,云服務(wù)與二次開發(fā)接口等多種產(chǎn)品使用形式。各個中間件API可以無縫地融合到客戶的各類復(fù)雜應(yīng)用系統(tǒng)之中,可兼容Windows,Linux, Android,Maemo5, FreeBSD等不同操作系統(tǒng)平臺,可以供Java,Python,C,C#等各類開發(fā)語言使用。