六十七、Elasticsearch内核原理-继续优化写入流程实现

作者: 编程界的小学生 | 来源:发表于2017-07-12 15:24 被阅读241次

六十七、Elasticsearch内核原理-继续优化写入流程实现
六十六、Elasticsearch内核原理-优化写入流程，实现N
66、内核原理探秘_继续优化写入流程实现durability可靠
18、ES内核写入数据流程以及流程优化、基于translog和c
65、内核原理探秘_优化写入流程实现NRT近实时（filesys
十八、Elastics Search内核相关原理
99 MySQL性能实战优化
67、内核原理探秘_最后优化写入流程实现海量磁盘文件合并（seg
ELASTICSEARCH 写入速度优化
High cardinality下对持续写入的Elasticse

1、完整的优化写入流程步骤

（1）数据写入buffer缓冲和translog日志文件

（2）每个1s，buffer中的数据被写入新的segment file，并进入os cache，此时segment就被打开并供search使用

（3）buffer被清空

（4）重复1~3，新增segment不断添加，buffer不断清空，而translog中的数据不断累加

（5）当translog长度达到一定程度的时候，commit操作发生

（5-1）buffer中的所有数据写入一个新的segment，并写入os cache，打开供使用
（5-2）buffer被清空
（5-3）一个commit point被写入磁盘，标明了所有的index segment
（5-4）filesystem cache中的所有index segment file缓存数据，被fsync强行刷到磁盘上
（5-5）现有的translog被清空，创建一个新的translog

2、图解

Paste_Image.png

3、基于translog和commit point，如何进行数据恢复？

fsync+清空translog，就是flush，默认每隔30分钟flush一次，或者当translog过大的时候，也会自动flush。

Paste_Image.png

手动flush的方法：
POST /my_index/_flush
一般别手动flush，让ES自动flush就好了。

4、其他
translog每隔5s被fsync一次到磁盘上，在一次增删改操作之后，当fsync在primary shard 和 replica shard都成功之后，那次增删改操作才会成功，但是这种在一次增删改时强行fsync translog可能会导致部分操作比较耗时，当允许部分数据丢失的话，建议设置异步fsync translog

PUT /my_index/_settings
{
    "index.translog.durability": "async",
    "index.translog.sync_interval": "5s"
}

若有兴趣，欢迎来加入群，【Java初学者学习交流群】：458430385，此群有Java开发人员、UI设计人员和前端工程师。有问必答，共同探讨学习，一起进步！
欢迎关注我的微信公众号【Java码农社区】，会定时推送各种干货：

qrcode_for_gh_577b64e73701_258.jpg

六十七、Elasticsearch内核原理-继续优化写入流程实现
1、完整的优化写入流程步骤（1）数据写入buffer缓冲和translog日志文件（2）每个1s，buffer...
六十六、Elasticsearch内核原理-优化写入流程，实现N
1、疑问每次都必须等待fsync将segment刷入磁盘，才能将segment打开供search使用，这样的话，从...
66、内核原理探秘_继续优化写入流程实现durability可靠
1、优化的写入流程（1）数据写入buffer缓冲和translog日志文件（2）每隔一秒钟，buffer中的数据...
18、ES内核写入数据流程以及流程优化、基于translog和c
主要内容： ES内核写入数据流程以及流程优化、基于translog和commit point 数据恢复和segme...
65、内核原理探秘_优化写入流程实现NRT近实时（filesys
现有流程的问题，每次都必须等待fsync将segment刷入磁盘，才能将segment打开供search使用，这样...
十八、Elastics Search内核相关原理
1、document写入内核原理（1）数据写入buffer （2）commit point （3）buffer中...
99 MySQL性能实战优化
mysql 性能优化一 MySQL架构与执行流程原理二 MySQL 索引底层实现原理三 MYSQL事务...
67、内核原理探秘_最后优化写入流程实现海量磁盘文件合并（seg
每秒一个segment file，文件过多，而且每次search都要搜索所有的segment，很耗时默认会在后台执...
ELASTICSEARCH 写入速度优化
提升ES的写入速度可以从以下几方面入手: 加大 translog flush ,可以降低 iops,writebl...
High cardinality下对持续写入的Elasticse
High cardinality下对持续写入的Elasticsearch索引进行聚合查询的性能优化背景最近使用...