拿 GPT 学 ElasticSearch 实在太鸡儿坑了

查看 176|回复 21
作者:BeautifulSoap   
可能算月经贴了,但是还是分享下自己刚刚被坑的经历
最近在学 ElasticSearch ,官方 Guide 文档找半天根本找不到面向新手介绍什么是 index ,shard ,primary shard, replica shard 这种概念的地方。于是试试看问 ChatGPT 和 new bing ,一路问下来我感觉如果你是要学一个完全不懂的东西最好别找 GPT ,说的知识前后矛盾,你指出来他就改,然后继续前后矛盾,如果你脑子转得不够灵活发现不了矛盾,你甚至怎么被坑得都不知道。搞得我都开始觉得它就是故意想坑我,聊着聊着火气就要上来了 orz 到最后我都分不清这两种前后矛盾的知识哪个是正确的了,越学越凌乱。
首先是 ChatGPT 的对话,现在已经可以分享对话了,大家可以看看我和 ChatGPT 的对话
https://chat.openai.com/share/c8ef6660-9649-4e79-9a03-e0dcb81bde2b
然后更绝的是同样的问题问 new bing

问:elasticsearch 指定主分片大于 1 的时候,每个主分片都保存有完整索引数据,还是每个主分片分别保存一部分数据


答: 当你指定主分片大于 1 时,每个主分片都保存有完整索引数据 1 。每个主分片都是一个完整的 Lucene 索引,它们之间没有任何关系。这意味着,如果你有 3 个主分片,那么你将有 3 个完整的 Lucene 索引。每个副本分片也是一个完整的 Lucene 索引,但它们只是主分片的副本

和上面链接里 ChatGPT 的回答安全矛盾。再见了您。所以,有人能回答下我问的这几个问题吗?

分片, chatgpt, 索引, Lucene

Leviathann   
问 es 聚合排序相关的问题也坑,完全没法用
openliucongbx   
我不是很懂 ElasticSearch
不知道 GPT4 的回答能不能满足你的问题
Elasticsearch 的 `index` 和 `shard` 之间存在紧密的关系。在讨论它们之间的关系之前,我们先了解一下这两个概念。
**Index (索引)**:Elasticsearch 中的索引是具有相似特征的文档集合。它类似于关系型数据库中的表。索引是用于存储和搜索数据的主要结构,可以在一个 Elasticsearch 集群中创建多个索引。
**Shard (分片)**:由于单个索引可能会变得非常大,不可能在一台服务器或节点上存储所有数据。为了解决这个问题,Elasticsearch 提供了分片功能。一个索引可以被分成多个更小的部分,称为分片。每个分片都可以独立地存储、搜索和处理数据。这使得 Elasticsearch 可以在多个服务器或节点上分布式处理和存储大量数据。
关于你的问题:
1. **shard 保存有 index 的所有数据吗?**:一个 index 的数据被分布在它的所有分片( shards )中。每个分片负责存储索引的一部分数据,所以单个分片并不包含整个索引的所有数据。将数据分布在多个分片中可实现水平扩展,提高查询性能。
2. **primary shard 和 replica shard 保存有 index 的所有数据吗?**:在 Elasticsearch 中,分片又分为两类:primary shard (主分片)和 replica shard (副本分片)。
- **Primary shard (主分片)**:每个索引都有一个或多个主分片,它们负责存储索引的数据。主分片的数量在创建索引时就确定了,之后不能更改。

- **Replica shard (副本分片)**:副本分片是主分片的拷贝,用于提高数据冗余和查询性能。副本分片的数量可以在创建索引后动态更改。
主分片和副本分片都包含索引的部分数据。主分片和它对应的副本分片包含相同的数据。这样做的目的是为了确保在主分片所在的节点发生故障时,数据不会丢失,同时还能提高查询性能,因为查询可以在主分片和副本分片上同时进行。
lambdaq   
es 的有些问题,还真轮不到怪罪 chatgpt 。因为 es 它丫的每个版本都有重大区别。。。。。
awesomes   
老老实实看官方文档和 stackoverflow 吧,问 GPT 就是你的不对了,听他一本正经的胡说八道只会把你带坑里
Yukiteru   
这种问题建议用英文问,得到的回答精确度会高很多
potatowish   
用英文提问
7gugu   
chatGPT 现在只能做到把一句话写的很像人,但还做不到保证一句话是正确的
BeautifulSoap
OP
  
@7gugu
@potatowish
GPT 的很多回答都是直接从英文里翻译过来的,所以其实语言问题不大。比如我用英文又问了上面中文里互相矛盾的问题,结果英文下它依旧互相矛盾
https://chat.openai.com/share/f157ab9c-4784-440a-b338-062182b71dad
ql562482472   
你要这样问他最起码得上 GPT4 ,在真实性上有巨大提升,然后就是我前几天也找 ES 的一些东西,我发现 search with bing 无法读取 es 官方文档的任何页面 不知道为啥 所以 gpt 问 es 知识恐怕有点难,不过可以试试 bard ,我用 bard 搜的 es 的信息还算准确 来源也是 es 官网文档
您需要登录后才可以回帖 登录 | 立即注册

返回顶部