信息抓取
信息抓取
信息抓取是將非結構化的信息從網站中抓取出來保存到結構化的資料庫中的過程。
目錄
信息抓取是企業信息化的根基和第一步,只有利用先進的技術作好了信息抓取工作,才能為信息化帶來最大的價值!現階段國內做信息抓取階段技術研究,比較突出的是深圳的樂思軟體。他們網站上有許多相關資料,可以去看看,
應用範圍:
關鍵信息抓取:獲取各種網際網路上各種各樣的專業信息資料庫
競爭情報系統:通過關鍵字監視網路媒體上自己與競爭對手的市場信息
企業內容管理:批量精確地獲取外部內容,並自動化處理
資料庫營銷:抽取留言本,論壇,新聞組上面目標潛在用戶的留言信息與聯繫信息
企業整合門戶:在EIP中嵌入外部網站的實時內容
比較系統:商品價格比較系統
網路信息集成:從多個同類網站中抽取信息並集成在一起,如個人簡歷,招聘信息,租賃信息,商品信息,公司名錄
個性化信息代理:將個人或企業感興趣的多個網站最新內容整合在一起,通過Email的形式或者網頁形式提供給用戶,節約用戶的逐個網站下載並瀏覽的時間