ASIA unversity:Item 310904400/100659
English  |  正體中文  |  简体中文  |  全文笔数/总笔数 : 94286/110023 (86%)
造访人次 : 21696713      在线人数 : 789
RC Version 6.0 © Powered By DSPACE, MIT. Enhanced by NTU Library IR team.
搜寻范围 查询小技巧:
  • 您可在西文检索词汇前后加上"双引号",以获取较精准的检索结果
  • 若欲以作者姓名搜寻,建议至进阶搜寻限定作者字段,可获得较完整数据
  • 进阶搜寻


    jsp.display-item.identifier=請使用永久網址來引用或連結此文件: http://asiair.asia.edu.tw/ir/handle/310904400/100659


    题名: 特徵選取於樣式分類模型之網頁探勘影響研究
    作者: 顏廷軒
    贡献者: 行動商務與多媒體應用學系
    关键词: 特徵選取;網頁探勘
    日期: 2016
    上传时间: 2016-08-12 05:37:54 (UTC+0)
    出版者: 亞洲大學
    摘要: 隨著網際網路的快速發展,網頁探勘(Web Mining)的議題一直受到大家的矚目,網頁內容探勘一般可視為文字探勘(Text Mining)的子範疇,目前以樣式分類模式(Pattern Taxonomy Model)為基礎的網頁探勘的方法主要分為兩大步驟,第一個步驟是透過文件索引(Indexing)的方式,建立字詞特徵空間(Feature Space);第二個步驟則是利用樣式進化 (Pattern Evolving) 技術,轉換特徵詞成更具描述力的樣式(Pattern),最後進行文件分類(Classification)或資訊過濾(Information Filtering)等相關應用的工作。然而,文件索引所遇到的困難是應如何找到適量且具重要性的特徵字詞,而樣式進化則是遇到如何以少量字詞整合出更具效能樣式的問題。本研究針對特徵選取技術用於PTM模型之影響進行探討,並選擇Probabilistic relevance Model以及Okapi Model BM25等兩種特徵選取方法進行網頁內容探勘實驗,了解對樣式組成的影響。實驗結果顯示,在少量特徵詞條件下,BM25明顯優於其他方法。
    显示于类别:[行動商務與多媒體應用學系] 博碩士論文

    文件中的档案:

    档案 描述 大小格式浏览次数
    index.html0KbHTML318检视/开启


    在ASIAIR中所有的数据项都受到原著作权保护.


    DSpace Software Copyright © 2002-2004  MIT &  Hewlett-Packard  /   Enhanced by   NTU Library IR team Copyright ©   - 回馈