Извлечь запись из нескольких массивов на основе фильтра

У меня есть документы в ElasticSearch со следующей структурой:

"_source": {
          "last_updated": "2017-10-25T18:33:51.434706",
          "country": "Italia",
          "price": [
            "a‚¬ 139",
            "a‚¬ 125",
            "a‚¬ 120",
            "a‚¬ 108"
          ],
          "max_occupancy": [
            2,
            2,
            1,
            1
          ],
          "type": [
            "Type 1",
            "Type 1 - (Tag)",
            "Type 2",
            "Type 2 (Tag)",
          ],
          "availability": [
            10,
            10,
            10,
            10
          ],
          "size": [
            "26 m?",
            "35 m?",
            "47 m?",
            "31 m?"
          ]
        }
      }

В основном записи данных разбиваются на 5 массивов, а поля одной и той же записи имеют одинаковое положение индекса в 5 массивах. Как видно из данных примера, существует 5 массивов (цена, max_occupancy, тип, доступность, размер), которые содержат значения, относящиеся к одному и тому же элементу. Я хочу извлечь элемент с максимальным полем max_occupancy больше или равным 2 (если нет записи с 2 захватом a 3, если нет 3 захвата четыре, ...), с более низкой ценой, в этом случае запись и поместите результат в новый объект JSON следующим образом:

{
          "last_updated": "2017-10-25T18:33:51.434706",
          "country": "Italia",
          "price: ": "a‚¬ 125",
          "max_occupancy": "2",
          "type": "Type 1 - (Tag)",
          "availability": 10,
          "size": "35 m?"
}  

В основном структура результатов должна показывать извлеченную запись (которая в этом случае является вторым индексом для всего массива) и добавлять к ней общую информацию (поля: «last_updated», «country»).

Можно ли извлечь такой результат из упругого поиска? Какой запрос мне нужно выполнить?

Может ли кто-нибудь предложить лучший подход?

elasticsearch,elasticsearch-5,

1

Ответов: 1


1 принят

Мой лучший подход: переход вложенный с помощью Nested Datatype

За исключением упрощения запросов, проще читать и понимать связи между теми объектами, которые в настоящее время разбросаны по разным массивам.

Да, если вы решите этот подход, вам придется отредактировать свое сопоставление и переиндексировать все ваши данные.

Как будет выглядеть сопоставление? что-то вроде этого:

{
  "mappings": {
    "properties": {
      "last_updated": {
        "type": "date"
      },
      "country": {
        "type": "string"
      },
      "records": {
        "type": "nested",
        "properties": {
          "price": {
            "type": "string"
          },
          "max_occupancy": {
            "type": "long"
          },
          "type": {
            "type": "string"
          },
          "availability": {
            "type": "long"
          },
          "size": {
            "type": "string"
          }
        }
      }
    }
  }
}

EDIT: новая структура документа (содержащая вложенные документы) -

{
  "last_updated": "2017-10-25T18:33:51.434706",
  "country": "Italia",
  "records": [
    {
      "price": "a‚¬ 139",
      "max_occupancy": 2,
      "type": "Type 1",
      "availability": 10,
      "size": "26 m?"
    },
    {
      "price": "a‚¬ 125",
      "max_occupancy": 2,
      "type": "Type 1 - (Tag)",
      "availability": 10,
      "size": "35 m?"
    },
    {
      "price": "a‚¬ 120",
      "max_occupancy": 1,
      "type": "Type 2",
      "availability": 10,
      "size": "47 m?"
    },
    {
      "price": "a‚¬ 108",
      "max_occupancy": 1,
      "type": "Type 2 (Tag)",
      "availability": 10,
      "size": "31 m?"
    }
  ]
}

Теперь его проще запросить для любого конкретного условия с помощью Nested Query и Inner Hits . например:

{
  "_source": [
    "last_updated",
    "country"
  ],
  "query": {
    "bool": {
      "must": [
        {
          "term": {
            "country": "Italia"
          }
        },
        {
          "nested": {
            "path": "records",
            "query": {
              "bool": {
                "must": [
                  {
                    "range": {
                      "records.max_occupancy": {
                        "gte": 2
                      }
                    }
                  }
                ]
              }
            },
            "inner_hits": {
              "sort": {
                "records.price": "asc"
              },
              "size": 1
            }
          }
        }
      ]
    }
  }
}

Условия являются: ItaliaAND max_occupancy > 2.

Внутренние хиты: сортируйте по возрастанию по цене и получите первый результат .

Надеюсь, вы найдете это полезным

elasticsearch, elasticsearch-5,
Похожие вопросы