Коли люди обговорюють масштабування електронної комерції, вони завжди зосереджуються на таких великих технологічних викликах, як розподілений пошук, інвентаризація, рекомендаційні системи. Але справжні проблеми, які турбують кожну платформу електронної комерції, зазвичай полягають у найпростіших питаннях: несумісності значень атрибутів продукту.
Значення атрибутів визначають всю систему пошуку продуктів. Вони підтримують фільтрацію, порівняння, ранжування пошуку та логіку рекомендацій. Однак у реальному каталозі товарів значення атрибутів рідко бувають чистими. Повторення, хаотичний формат, нечітка семантика — це норма.
Подивіться на такий, здавалося б, простий атрибут, як "Розмір": ["XL", "Small", "12cm", "Large", "M", "S"]
А тепер "Колір": ["RAL 3020", "Crimson", "Red", "Dark Red"]
Огляд цих хаотичних значень здається без проблем, але коли у вас понад 3000000+