博客
关于我
Nearth---全文检索技术(luncen)/002(全文检索的概念)
阅读量:185 次
发布时间:2019-02-28

本文共 396 字,大约阅读时间需要 1 分钟。

什么是全文检索?

数据的分类:

1,结构化数据

格式固定,长度固定,数据类型固定

eg:数据库中的数据

2,非结构化数据

word文档,pdf文档,邮件,html,txt

格式不固定,长度不固定,数据类型不固定。

数据的查询:

1,结构化数据的查询

SQL语句,查询结构化数据的方法。简单,速度快。

2,非结构化数据的查询

从文本文件中找出包含spring单词的文件

a,自测

b,使用程序把文档读取到内存中,然后匹配字符串,顺序扫描。

c,把非结构化数据转化为结构化文档

---先根据空格进行字符串的拆分,得到一个单词列表,基于单词列表创建一个索引。

然后查询索引,根据单词和文档的对应关系找到文档列表,这个过程叫全文检索。

--索引:一个为了提高查询速度,创建某种数据结构的集合。

3,全文检索:

先创建索引,然后查询索引的过程叫做全文检索。

索引一次创建多次使用,表现为每次查询速度快。

转载地址:http://qrmn.baihongyu.com/

你可能感兴趣的文章
Netty事件注册机制深入解析
查看>>
Netty原理分析及实战(四)-客户端与服务端双向通信
查看>>
Netty客户端断线重连实现及问题思考
查看>>
Netty工作笔记0006---NIO的Buffer说明
查看>>
Netty工作笔记0007---NIO的三大核心组件关系
查看>>
Netty工作笔记0011---Channel应用案例2
查看>>
Netty工作笔记0013---Channel应用案例4Copy图片
查看>>
Netty工作笔记0014---Buffer类型化和只读
查看>>
Netty工作笔记0020---Selectionkey在NIO体系
查看>>
Vue踩坑笔记 - 关于vue静态资源引入的问题
查看>>
Netty工作笔记0025---SocketChannel API
查看>>
Netty工作笔记0027---NIO 网络编程应用--群聊系统2--服务器编写2
查看>>
Netty工作笔记0050---Netty核心模块1
查看>>
Netty工作笔记0057---Netty群聊系统服务端
查看>>
Netty工作笔记0060---Tcp长连接和短连接_Http长连接和短连接_UDP长连接和短连接
查看>>
Netty工作笔记0063---WebSocket长连接开发2
查看>>
Netty工作笔记0070---Protobuf使用案例Codec使用
查看>>
Netty工作笔记0077---handler链调用机制实例4
查看>>
Netty工作笔记0084---通过自定义协议解决粘包拆包问题2
查看>>
Netty工作笔记0085---TCP粘包拆包内容梳理
查看>>