產(chǎn)品介紹
隨著計算機互聯(lián)網(wǎng)、移動互聯(lián)網(wǎng)、物聯(lián)網(wǎng)、平板電腦、手機的大眾化和微博、論壇、微信等網(wǎng)絡(luò)交流方式的日益紅火,數(shù)據(jù)資料的增長正發(fā)生著巨大的變化。大數(shù)據(jù)興起的主要原因是數(shù)據(jù)量越來越大。從監(jiān)測的數(shù)據(jù)來看,數(shù)據(jù)量越來越多,每年都會翻番,數(shù)據(jù)一直在飛速增長;針對即時數(shù)據(jù)的處理也變得越來越快;通過各種終端,比如手機、PC、服務(wù)器等產(chǎn)生的數(shù)據(jù)越來越多。隨之而來的數(shù)據(jù)倉庫、數(shù)據(jù)安全、數(shù)據(jù)分析、數(shù)據(jù)挖掘等等圍繞大數(shù)據(jù)的商業(yè)價值的利用逐漸成為行業(yè)人士爭相追捧的利潤焦點。隨著大數(shù)據(jù)時代的來臨,大數(shù)據(jù)分析也應(yīng)運而生。
在大數(shù)據(jù)時代,數(shù)據(jù)挖掘是最關(guān)鍵的工作。大數(shù)據(jù)的挖掘是從海量、不完全的、有噪聲的、模糊的、隨機的大型數(shù)據(jù)庫中發(fā)現(xiàn)隱含在其中有價值的、潛在有用的信息和知識的過程,也是一種決策支持過程。其主要基于人工智能,機器學(xué)習(xí),模式學(xué)習(xí),統(tǒng)計學(xué)等。通過對大數(shù)據(jù)高度自動化地分析,做出歸納性的推理,從中挖掘出潛在的模式,可以幫助企業(yè)、商家、用戶調(diào)整市場政策、減少風(fēng)險、理性面對市場,并做出正確的決策。
北京理工大學(xué)大數(shù)據(jù)搜索與挖掘?qū)嶒炇覐埲A平主任研發(fā)的NLPIR大數(shù)據(jù)語義智能分析技術(shù)是對語法、詞法和語義的綜合應(yīng)用。NLPIR大數(shù)據(jù)語義智能分析平臺平臺是根據(jù)中文數(shù)據(jù)挖掘的綜合需求,融合了網(wǎng)絡(luò)采集、自然語言理解、文本挖掘和語義搜索的研究成果,并針對互聯(lián)網(wǎng)內(nèi)容處理的全技術(shù)鏈條的共享開發(fā)平臺。
其中KGB(Knowledge Graph Builder)知識圖譜引擎是我們自主研發(fā)的知識圖譜構(gòu)建與推理引擎,基于漢語詞法分析的基礎(chǔ)上,采用KGB語法實現(xiàn)了實時 的知識生成,可以從非結(jié)構(gòu)化文本中抽取各類知識,并實現(xiàn)了從表格中抽取指定的內(nèi)容等。KGB同時可以定義不同的動作,如抽取動作,并能自定義各類后處理程序。利用KGB知識圖譜引擎可以抽取到產(chǎn)品的詳細報價信息,方便進行下一步的數(shù)據(jù)挖掘與圖譜構(gòu)建。
數(shù)據(jù)挖掘技術(shù)是一個發(fā)展十分快的領(lǐng)域,?隨著對數(shù)據(jù)挖掘技術(shù)在各領(lǐng)域日益廣泛的應(yīng)用,實現(xiàn)了數(shù)據(jù)資源共享及技術(shù)發(fā)展的跨域,從而大大提高了工作效率,并帶來巨大的成功。21世紀是信息時代的社會,“信息不僅是資源,更是財富”,要實現(xiàn)經(jīng)濟的騰飛,需依賴高新尖科技的發(fā)展,故利用提供的信息,充分進行數(shù)據(jù)挖掘,則將為數(shù)據(jù)庫的應(yīng)用開辟了廣闊的前景,也為人類的文明開辟了一個嶄新的時代。