English  |  正體中文  |  简体中文  |  Items with full text/Total items : 94286/110023 (86%)
Visitors : 21692995      Online Users : 1016
RC Version 6.0 © Powered By DSPACE, MIT. Enhanced by NTU Library IR team.
Scope Tips:
  • please add "double quotation mark" for query phrases to get precise results
  • please goto advance search for comprehansive author search
  • Adv. Search
    HomeLoginUploadHelpAboutAdminister Goto mobile version


    Please use this identifier to cite or link to this item: http://asiair.asia.edu.tw/ir/handle/310904400/100659


    Title: 特徵選取於樣式分類模型之網頁探勘影響研究
    Authors: 顏廷軒
    Contributors: 行動商務與多媒體應用學系
    Keywords: 特徵選取;網頁探勘
    Date: 2016
    Issue Date: 2016-08-12 05:37:54 (UTC+0)
    Publisher: 亞洲大學
    Abstract: 隨著網際網路的快速發展,網頁探勘(Web Mining)的議題一直受到大家的矚目,網頁內容探勘一般可視為文字探勘(Text Mining)的子範疇,目前以樣式分類模式(Pattern Taxonomy Model)為基礎的網頁探勘的方法主要分為兩大步驟,第一個步驟是透過文件索引(Indexing)的方式,建立字詞特徵空間(Feature Space);第二個步驟則是利用樣式進化 (Pattern Evolving) 技術,轉換特徵詞成更具描述力的樣式(Pattern),最後進行文件分類(Classification)或資訊過濾(Information Filtering)等相關應用的工作。然而,文件索引所遇到的困難是應如何找到適量且具重要性的特徵字詞,而樣式進化則是遇到如何以少量字詞整合出更具效能樣式的問題。本研究針對特徵選取技術用於PTM模型之影響進行探討,並選擇Probabilistic relevance Model以及Okapi Model BM25等兩種特徵選取方法進行網頁內容探勘實驗,了解對樣式組成的影響。實驗結果顯示,在少量特徵詞條件下,BM25明顯優於其他方法。
    Appears in Collections:[行動商務與多媒體應用學系] 博碩士論文

    Files in This Item:

    File Description SizeFormat
    index.html0KbHTML318View/Open


    All items in ASIAIR are protected by copyright, with all rights reserved.


    DSpace Software Copyright © 2002-2004  MIT &  Hewlett-Packard  /   Enhanced by   NTU Library IR team Copyright ©   - Feedback