
会员
自己动手写搜索引擎
更新时间:2018-12-28 22:52:39 最新章节:参考资料
书籍简介
本书是猎兔企业搜索开发团队的软件产品研发和项目实践的经验汇总。本书全方位展现出一个商用级别的Lucene搜索解决方案,主要包括爬虫、自然语言处理和搜索实现部分。爬虫部分介绍了网页遍历方法和从网页提取主要内容的方法。自然语言处理部分包括了中文分词从理论到实现以及在搜索引擎中的实用等细节。其他自然语言处理的经典问题与实现包括:文档排重、文本分类、自动聚类、语法解析树、拼写检查、拼音转换等理论与实现方法。
上架时间:2009-12-01 00:00:00
出版社:电子工业出版社
上海阅文信息技术有限公司已经获得合法授权,并进行制作发行
最新章节
罗刚编著
同类热门书
最新上架
- 会员《餐饮管理与经营全案——互联网思维创新餐饮管理和运营模式》一书,从互联网思维下的餐饮变革导入,分三个部分。第一部分(互联网思维创新之系统智能化)包括智能餐饮管理系统,智能点餐系统建设,智能结算系统建设,智能厨房显示系统建设,外卖业务系统建设,食品安全管控系统建设。第二部分(互联网思维创新之营销多样化)包括微博营销,微信公众号营销,短视频营销,会员大数据营销,外卖平台营销。第三部分(互联网思维创新之计算机10万字
- 会员本书系统地讲述了HTML5、CSS3、JavaScript、Bootstrap等开发技术,满足Web前端开发基础学习的需求。本书包括了HTML5与CSS3的典型案例、使用Bootstrap框架开发、响应式布局等内容,适应Web前端开发从PC端转向移动端的变化。计算机14.3万字
- 会员本书全面介绍了Web标准的三个主要组成部分:HTML、CSS和JavaScript。循序渐进的讲述Web开发所涉及的三大前端技术的内容、应用技巧以及它们的综合应用。每部分都配置了大量的实用案例,图文并茂,效果直观。全书共21章,分为四个部分。在HTML部分,系统介绍了主要讲述了主要讲述了HTML基本概念、常用文本标签、文档结构标签、在网页中插入多媒体内容、列表、DIV标签、元素类型、在网页中创建超计算机13.2万字
- 会员本书是Java入门书籍,适合初学者使用。全书共13章,第1章主要讲解Java的特点与发展史、JDK的使用、Java程序的编写与运行机制、Java开发环境的搭建等;第2~6章主要讲解Java编程基础知识,包括Java基本语法、面向对象、JavaAPI和集合;第7~12章主要讲解Java进阶知识,包括I/O、多线程、网络编程、JDBC、GUI、Java反射机制;第13章带领读者开发一个综合项目——基计算机20万字
- 会员本书立足于新工科和工程教育,从工程应用和实践者的视角,全面系统地介绍了目前在工业界中使用最为广泛的JDK8的全部核心知识。全书共17章,主要内容包括Java概述、Java基本类型与运算符、程序流程控制、数组、类与对象、抽象类、接口与嵌套类、GUI编程、Swing高级组件、异常与处理、I∕O流与文件、多线程与并发、容器框架与泛型、字符串与正则表达式、反射与注解。本书适合可作为普通高等院校、高职院校计算机21万字
- 会员本书是一份旨在帮助Java求职者在面试中脱颖而出的重要指南。本书涵盖Java并发编程的多个关键主题,如并发原理和线程安全、并发关键字原理、并发锁和死锁、并发容器和工具、并发线程池以及并发设计与实战等。本书的特色在于将“大厂”“名企”的面试问题和实践经验相结合,不仅对面试问题和面试官心理进行深度剖析,还对面试问题解答和相关技术点进行详细介绍,这样更有利于读者全面理解相关知识点和技术,并能够在实际工作计算机17.6万字
同类书籍最近更新
- 会员《零基础学Struts》由浅入深、循序渐进地介绍了Struts2框架的知识点。重点介绍了Struts2的类型转换、输入校验、拦截器、国际化、标签库以及Struts2的Ajax支持。后通过两个实际案例来演示如何将Struts运用到实际项目开发中。Struts2框架继承了Struts和WebWork两个框架的易用性,其功能相比Struts和WebWork要更加强大。Struts2从诞生至今,以其功能的程序设计13.8万字