• 文本挖掘(Text mining)有时也被称为文字探勘、文本数据挖掘等,大致相当于文字分析,一般指文本处理过程中产生高质量的信息。高质量的信息通常通过分类和预测来产生,如模式识别。文本挖掘通常涉及输入文本的处理过程(通常进行分析,同时加上一些衍生语言特征以及消除杂音,随后插入到数据库中)...
    16 KB (1,989 words) - 09:51, 25 November 2023
  • 文本情感分析(也称为意见挖掘)是指用自然语言处理、文本挖掘以及计算机语言学等方法来识别和提取原素材中的主观訊息。 通常来说,情感分析的目的是为了找出说话者/作者在某些话题上或者针对一个文本两极的观点的态度。这个态度或许是他或她的个人判断或是评估,也许是他当时的情感状态(就是说,作者在做出这个言论时的...
    18 KB (2,096 words) - 08:27, 13 July 2023
  • (statistics)) 支持向量机 文本挖掘 代理挖掘(英语:Agent mining) 应用领域 解析学(英语:Analytics) 行为信息学(英语:Behavior informatics) 大數據 生物信息学 商业智能 数据分析 資料倉儲 决策支持系统 领域驱动的数据挖掘(英语:Domain driven...
    19 KB (2,588 words) - 18:40, 10 January 2024
  • 文字探勘,也被稱為文本挖掘、文字採礦、智慧型文字分析、文字資料探勘或文字知識發現,一般而言,指的是從非結構化的文字中,萃取出有用的重要資訊或知識。文字探勘是一個剛起步的學科領域,它是透過資訊擷取、資料探勘、機械學習、統計學、電腦語言學來達成。大部分的資訊(超過80%)都是以文字儲存,因此,文字探勘被認為是有高度的潛在商業價值。...
    707 bytes (80 words) - 09:52, 25 November 2023
  • 文本分割(Text segmentation)将书面文本分割成有意义单位的过程,如单词、句子或主题。这个术语既适用于人类阅读文本时的心理过程,也适用于在计算机中实现的人工过程,后者属于自然语言处理的领域。一些书面语言有明确的单词分界标记,例如英语的词之间有空格标识,阿拉伯语有独特的首、中、末字母形状,但这种标记不是所有书面语言都有。...
    2 KB (246 words) - 15:04, 18 September 2023
  • 作为信息检索的先驱者之一,Hans Peter Luhn(英语:Hans Peter Luhn)创造了这个短语,并在他的研究中应用这个概念,推动了这个概念的使用。 文本挖掘 概念挖掘 信息提取 自然语言处理 查询扩展 词干提取 搜索引擎标引 功能词 Luhn, H. P. Keyword-in-Context Index...
    4 KB (495 words) - 13:59, 18 September 2023
  • LDA首先由 David M. Blei、吴恩达和迈克尔·I·乔丹于2003年提出,目前在文本挖掘领域包括文本主题识别、文本分类以及文本相似度计算方面都有应用。 LDA是一种典型的词袋模型,即它认为一篇文档是由一组词构成的一个集合,词与词之间没有顺序以及先后的关...
    7 KB (1,205 words) - 22:37, 29 April 2023
  • 自动标引 (category 数据挖掘)
    文本挖掘域被称为关键词抽取(英語:Keyword Extraction),在计算语言学领域通常着眼于术语自动识别(英語:Automatic Term Recognition),在訊息检索领域,就是指自动标引。自动标引属于文本訊息抽取的范畴。文本訊息抽取是从文本数据中抽取人们关注的特定的訊息。...
    9 KB (1,502 words) - 07:09, 14 October 2022
  • 圖靈機(Turing Machine),一種抽象的計算模型。 time.h,C語言的Library。 .tm,土庫曼國家及地區頂級域(ccTLD)的域名。 文本挖掘(Text mining) Tencent Messenger,中国深圳腾讯公司针对办公环境推出的免费即时通讯软件,可与QQ互联互通 他媽的,罵人的髒話...
    1 KB (126 words) - 10:28, 2 November 2023
  • 文档分类 (category 数据挖掘)
    主题 (文档)(英语:Subject (documents)) 主题索引(英语:Subject indexing) 文本挖掘, 网页挖掘(英语:web mining), 概念挖掘(英语:concept mining) Fabrizio Sebastiani. Machine learning in...
    11 KB (1,331 words) - 15:39, 14 January 2024
  • search)(Vertical search) 计算机科学 文本自动摘要 索引 倒排索引 搜索引擎列表 搜索服务 企业搜索供应商 搜索引擎优化 搜索建议下拉列表(英语:Search suggest drop-down list) 求解程序(英语:Solver) 垃圾索引 SQL 文本挖掘 Voorhees, E.M. Natural...
    5 KB (695 words) - 14:17, 31 December 2022