-
Notifications
You must be signed in to change notification settings - Fork 139
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
ES迁移数据量不对 #39
Comments
Hi,@WayneLee5991: https://esdoc.bbossgroups.com/#/db-es-tool |
我使用了2.3.12中的ExportResultHandler,batchsize设置为5000,假设数据量为4000万,那么处理成功5000条机会调用success方法,有没有一个方式可以监听全部处理成功呢??或者是需要自己计数?? |
看看章节: |
可以加入bboss的讨论开发群进一步交流 对于你的情况建议如下 1、batchSize,fetchSize我修改为5000,threadCount=100,queueSize=200,几乎都是官方文档里的最小值。但是还是会sockettimeout 。目标ES集群不是我们管理的,优化需要和他们交流。 2、如果4000万的数据迁移到一半出错了,我想使用增量方法,增量字段是否支持_id?我们集群的索引id是自定义的long类型的数据 |
我把batchSize和fetchSize修改为500,threadCount修改为5,处理几个千万级别的索引后还是会报sockerTimeOut异常,是不是这个目标ES集群有点过于垃圾了。 |
Hi,@WayneLee5991 CustomExportResultHandler:Task[Import DB Data to Elasticsearch] rejected 100 times bboss作为一个数据源同步工具,可以根据同步作业部署服务器配置、elasticsearch服务器处理能力,灵活调整数据同步作业参数,在确保数据准确性的前提下,追求最佳的同步性能和速度 |
bboss版本:6.2.2
ES版本:7.3.2
ES迁移的时候,日志显示ES2ESDataTranPlugin: Export completed and export total 1000 records
但是目标集群对应的索引有的数据量和源集群一致,有的不一致,丢失了数据。。。
当数据量比较小的时候,数据量基本一致,但是当数据量打到百万千万级别的时候,总差个几千条。。
The text was updated successfully, but these errors were encountered: