Продължете към съдържанието

Нетфликс и линейна алгебра

Част от чудесната радио-серия "Engines of our Ingenuity"

Компаниите, които доминират в мрежата, са тези, които най-добре ви насочват към информацията, която търсите – към книгата, компактдиска или филма, който ще ви хареса най-много. Това до голяма степен се постига с помощта на линейната алгебра, клон на математиката, който се занимава с манипулиране на колони и масиви от числа.

Почти всеки е запознат с онлайн услугата за отдаване на филми под наем Netflix. След като гледате филм на Netflix, ще бъдете помолени да го оцените между една и пет звезди. Важна част от работата на компанията е Cinematch, алгоритъм, който определя на какви филми може да се насладите въз основа на тези оценки.

Лесен начин да определите дали искате „Седемте самураи“, например, е да осредните всички оценки, които този филм е получил от други потребители. Това обаче не е много добър подход, защото игнорира дали харесвате или не харесвате самурайските филми. Наистина, настоящият алгоритъм на Netflix базира своите препоръки на оценките на потребители като вас.

Но как да решите кои потребители са като вас? Тук се намесва линейната алгебра. Представете си гигантска електронна таблица с колони, наречени на всеки един от десетките хиляди филми, налични в Netflix. Всеки един от няколкото милиона абонати отговаря на ред в тази електронна таблица. Когато потребител оцени филм, се попълва запис. Например, ако избера да дам четири звезди на „Матрицата“, колоната, съответстваща на този филм, ще бъде актуализирана на реда, съответстващ на моето име.

Малцина оценяват повече от няколкостотин филма, така че само част от процента от тази гигантска електронна таблица всъщност е попълнена. Работата на алгоритъма за препоръки е да попълни цялата електронна таблица въз основа на тази много оскъдна информация. Как това може да стане ефективно?

Преди около три години Netflix предложи милион долара на всеки, който подобри точността на техните препоръки с 10%. Екипи от софтуерни инженери и ентусиасти от цял свят взеха участие в това предизвикателство. Най-успешните подходи се основават на линейна алгебра: Въпреки че електронната таблица с потребителски предпочитания е огромна, може би има няколко дузини стереотипни рейтингови профили. Вкусовете на всеки се описват като смесица от тези профили. Например, може да харесате уестърни и от време на време комедия. Линейната алгебра може да идентифицира тези стереотипни профили и да предостави магическия микс, който ви описва.

Подобрения от 8 и 9 процента на съществуващия алгоритъм на Netflix бяха постигнати бързо след обявяването на наградата. Целта от 10 процента обаче се оказа непостижима. След три години екип от програмисти от цял свят най-накрая го разбиха през юли 2009 г. Те направиха това, като взеха предвид, че нашите предпочитания се променят значително с времето.

Мощни алгоритми оформят това, което виждате във вашия уеб браузър. Те могат също така неусетно да ви насочат към следващата книга, която ще прочетете, и CD, който ще слушате. Когато отговорите на тези предложения чрез предоставяне на обратна връзка, вие оформяте не само вашите бъдещи препоръки, но и тези на всички останали, които използват същата услуга. Вие участвате в разговор между машини и човечеството.

Аз съм Крешо Йосич от университета в Хюстън, където се интересуваме от начина, по който работят изобретателните умове.

Copy link
URL has been copied successfully!