驾驭文本:文本的发现、组织和处理

副标题:无

作   者:(美)英格索尔,(美)莫顿,(美)法里斯 著,王斌 译

分类号:

ISBN:9787121252303

微信扫一扫,移动浏览光盘

简介

  文本处理是目前互联网内容应用(如搜索引擎、推荐引擎)的关键技术。本书涵盖了文本处理概念和技术的多个方面,包括文本预处理、搜索、字符串匹配、信息抽取、命名实体识别、分类、聚类、标签生成、摘要、问答等。本书的特点在于通过实例来理解文本处理的这些概念和技术,读者利用现有的开源工具就可以自己实现这些实例。

目录

第1章 开始驾驭文本
1.1 驾驭文本重要的原因
1.2 预览:一个基于事实的问答系统  
1.2.1 嗨,弗兰肯斯坦医生
1.3 理解文本很困难  
1.4 驾驭的文本
1.5 文本及智能应用:搜索及其他
1.5.1 搜索和匹配
1.5.2 抽取信息
1.5.3 对信息分组
1.5.4 一个智能应用  
1.6 小结  
1.7 相关资源

 
第2章 驾驭文本的基础
2.1 语言基础知识
2.1.1 词语及其类别  
2.1.2 短语及子句
2.1.3 词法
2.2 文本处理常见工具
2.2.1 字符串处理工具  
2.2.2 词条及切词
2.2.3 词性标注
2.2.4 词干还原
2.2.5 句子检测
2.2.6 句法分析和文法  
2.2.7 序列建模
2.3 从常见格式文件中抽取内容并做预处理
2.3.1 预处理的重要性  
2.3.2 利用Apache Tika抽取内容
2.4 小结  
2.5 相关资源


第3章 搜索
3.1 搜索和多面示例:Amazon.com  
3.2 搜索概念入门
3.2.1 索引内容
3.2.2 用户输入
3.2.3 利用向量空间模型对文档排名
3.2.4 结果展示
……


第4章 模糊字符串匹配
第5章 命名实体识别
第6章 文本聚类
第7章 分类及标注
第8章 构建示例问答系统
第9章 未驾驭的文本:探索未来前沿

 

已确认勘误

次印刷

页码 勘误内容 提交人 修订印次

驾驭文本:文本的发现、组织和处理
    • 名称
    • 类型
    • 大小

    光盘服务联系方式: 020-38250260    客服QQ:4006604884

    意见反馈

    14:15

    关闭

    云图客服:

    尊敬的用户,您好!您有任何提议或者建议都可以在此提出来,我们会谦虚地接受任何意见。

    或者您是想咨询:

    用户发送的提问,这种方式就需要有位在线客服来回答用户的问题,这种 就属于对话式的,问题是这种提问是否需要用户登录才能提问

    Video Player
    ×
    Audio Player
    ×
    pdf Player
    ×
    Current View

    看过该图书的还喜欢

    some pictures

    解忧杂货店

    东野圭吾 (作者), 李盈春 (译者)

    loading icon