A Method of Detecting Approximate Repetitive News Documents,ERICDATA高等教育知識庫
高等教育出版
熱門: 崔雪娟  王善边  朱丽彬  王美玲  黃乃熒  李明昆  
高等教育出版
首頁 臺灣期刊   學校系所   學協會   民間出版   大陸/海外期刊   政府機關   學校系所   學協會   民間出版   DOI註冊服務
篇名
A Method of Detecting Approximate Repetitive News Documents
並列篇名
A Method of Detecting Approximate Repetitive News Documents
作者 Xueping LiangXiaojun Wen
英文摘要
In view of the phenomenon of too much repeated webpage on the Internet, this paper proposes an approximately duplicate webpage detection algorithm and system , which combined multi-feature fingerprint cluster detection with document similarity detection. In this scheme, the multi-feature fingerprint cluster detection is used first to ensure the precision and efficiency of the algorithm; for small portion of the document that not be recalled, approximately duplicate webpage detection algorithm is used to guarantee the recall rate. The scheme has good improvements in the aspects of precision and recall rate, and at the same time has a good balance on performance.
起訖頁 104-109
關鍵詞 approximate repetition of documentsdocument clustersmulti-feature fingerprint clusters
刊名 電腦學刊  
期數 201804 (29:2期)
DOI 10.3966/199115992018042902011   複製DOI
QR Code
該期刊
上一篇
Signal decimation representation associate with the algebraic signal processing
該期刊
下一篇
Research on Electric Power Monitoring System Based on Wireless Big Data Platform

高等教育知識庫  閱讀計畫  教育研究月刊  新書優惠  

教師服務
合作出版
期刊徵稿
聯絡高教
高教FB
讀者服務
圖書目錄
教育期刊
訂購服務
活動訊息
數位服務
高等教育知識庫
國際資料庫收錄
投審稿系統
DOI註冊
線上購買
高點網路書店 
元照網路書店
博客來網路書店
教育資源
教育網站
國際教育網站
關於高教
高教簡介
出版授權
合作單位
知識達 知識達 知識達 知識達 知識達 知識達
版權所有‧轉載必究 Copyright2011 高等教育文化事業股份有限公司  All Rights Reserved
服務信箱:edubook@edubook.com.tw 台北市館前路 26 號 6 樓 Tel:+886-2-23885899 Fax:+886-2-23892500