19.08.2016, 15:37:31
Войти Зарегистрироваться
Авторизация на сайте

Ваш логин:

Ваш пароль:

Забыли пароль?

Навигация
Новости
Архив новостей
Реклама
Календарь событий
Right Left

Розпізнавання почерку лікарів і віртуальна примірка одягу: як використовується комп'ютерний зір вже зараз

  1. Комп'ютерне зір не для котиків Комп'ютерне зір уже перейшло з розряду технологій майбутнього ...
  2. Кейс 1: дізнаватися людей
  3. Кейс 2: бачити за тих, хто не бачить
  4. Кейс 3: заповнювати дані
  5. Кейс 4: переводити з лікарського на російський
  6. Кейс 5: чи не затнутися про тригери
  7. Кейс 6: роботизировать доктора Хауса
  8. Кейс 7: не дати гречці зникнути з полиць
  9. Кейс 8: тримати поставки під контролем
  10. Кейс 9: стежити, щоб в розетці завжди був струм
  11. Кейс 10: не дати виробничому процесу зупинитися
  12. Кейс 11: примірка для тих, хто ненавидить приміряти
  13. Кейс 12: малювати, як художник
  14. Кейс 13: роздрукувати фото з Instagram на білборд
  15. замість висновку

Комп'ютерне зір не для котиків

Комп'ютерне зір уже перейшло з розряду технологій майбутнього в категорію повсякденності. Саме завдяки йому можна розблокувати флагманський смартфон Apple «Силою погляду» або розібрати особи друзів на фотографіях.

Останні кілька років розвитку штучного інтелекту привели до значного ривка і в сфері технологій розпізнавання образів. Вони навіть стали застосовуватися розробниками в побуті просто заради розваги: ​​хтось створює систему можна було легко розпізнати кота , Щоб в будинок не проникали інші тварини, інший розробляє антікошачью водяну сигналізацію , Щоб прогнати непроханих пухнастих гостей з газону.

Навчена на великій вибірці система зможе розпізнавати різні об'єкти в різних ракурсах і при цьому знати, що конкретно зображено: комп'ютер, букет, Чумацький шлях або Ейфелева вежа.

Вважається, що точність визначення об'єктів людиною - в районі 87-93%, в той час як точність визначення спеціально навченого комп'ютера наближається до 100%. При цьому використовувати комп'ютерний зір можна практично в будь-якій області - від промисловості і медицини до дизайну і рітейлу.

підписуйтесь на канал Rusbase в «Яндекс.Дзен» , Щоб нічого не пропустити

Чинником, що гальмує розвиток ринку, сьогодні є аж ніяк не технологія. Складність в тому, що бізнесу не зовсім очевидні вигоди від використання комп'ютерного зору в виробничих процесах. Як правило, на стороні замовника є люди, які думають про прямий заробіток, але мало тих, хто розуміє, як за допомогою сучасних технологій можна оптимізувати монотонну роботу, зробивши підприємство ще більш ефективним, а продукт привабливим. І щоб якось спростити цю задачу і дати грунт для роздумів, я розповім про ряд кейсів, які ми виявили, працюючи з нашими клієнтами і замовниками проекту Vision.

Комп'ютерне зір і невидима рука ринку

Компанії в усьому світі все активніше використовують комп'ютерний зір і вкладають величезні гроші в розвиток штучного інтелекту в цілому. За даними McKinsey, в 2016 році світовий бізнес інвестував в цю сферу від 26 до 39 мільярдів доларів, а за три роки (з 2013) обсяг вкладень збільшився в три рази . У Gartner ж вважають, що до 2020 року в AI-технології буде інвестувати майже третину компаній в світі.

Комп'ютерне зір - один з найперспективніших сегментів галузі штучного інтелекту . З його допомогою можна автоматизувати будь-який людська праця, заснований на візуальній перевірці, яка полягає в звірці оригіналу з тим, що зображено на фотографії, відбувається на відео або в виробничому процесі.

Аналітики PricewaterhouseCoopers прогнозують, що до 2030 року штучний інтелект збільшить продуктивність праці в світі на 55%, а його потенційний внесок в світову економіку до цього часу складе 15,7 трильйона доларів. І на російському ринку є запит на цю технологію. У 2017 році аналітики TAdviser оцінили обсяг російського ринку штучного інтелекту в 700 мільйонів рублів, але в найближчі три роки вони прогнозують зростання до 28 мільярдів рублів (в 40 разів).

Ми теж плануємо отримати свій шматок цього пирога - для цього в рамках платформи «Mail.Ru для бізнесу» ми запустили сервіс Vision. І за час його роботи у нас накопичилася база завдань, які можна вирішувати за допомогою цієї технології: якісь з них виросли з замовлень, з якими до нас приходили клієнти, інші народилися в результаті мозкових штурмів, які ми організуємо для наших замовників. Сама технологія на сьогоднішній день не є чимось унікальним: бізнесу не потрібна просто «распознавалка», замовник хоче, щоб технологія допомогла йому оптимізувати його бізнес-процеси. Аналізом цих процесів і пошуком моментів, які можна поліпшити за допомогою Vision, і займається наша команда.

Кейс 1: дізнаватися людей

Це найочевидніший, очікуваний і частий запит, коли мова заходить про комп'ютерному зорі. Клієнтам цікаво автоматизувати вхід на підприємство і почати дізнаватися клієнтів. Але це далеко не єдиний варіант застосування технології.

Наприклад, якщо ви живете в Москві і їздите на метро, ​​вас дізнаються розумні камери. У московській підземці сьогодні працює інтелектуальна система відеоспостереження, заснована саме на комп'ютерному зорі.

Якщо камера побачить серед пасажирів злочинця, який перебуває в розшуку, або помітить сутичку, система дасть сигнал. Інформація в режимі реального часу передається в Пункт управління забезпеченням транспортної безпеки.

Готовність: 9 Шерлоків з 10 - система вже працює, хіба що поки не рознімає бійки сама.

Кейс 2: бачити за тих, хто не бачить

Комп'ютерне зір може частково замінити очі незрячим людям зі слабким зором. Для цього потрібно камера (наприклад, вбудована в окуляри) і процесор: камера транслює все, що бачить, комп'ютер озвучує це. Таким чином, незрячі люди можуть «бачити», що перед ними (дорога, машина, двері, стіна, натовп), «читати» етикетки на продуктах.

Компанія Baidu Research розробила прототип пристрою DuLight, яке сканує простір перед користувачем і відправляє отриману інформацію на смартфон.

Після обробки та ідентифікації предмета в навушник передається його Аудіокоментар ( «бачу світлофор, світло червоний»). А стартап Orcam, вирішальний ту ж задачу, недавно приєднався до лав єдинорогів.

Готовність: 5 Васко да Гама з 10 - прототипи вже є, але в масове виробництво поки не пішли.

Кейс 3: заповнювати дані

Комп'ютерне зір дозволяє розпізнати і оцифрувати практично що завгодно. Приклад з повсякденного життя: програма не змушує вас вводити номер банківської карти вручну, а пропонує навести камеру смартфона і автоматично заповнює цифри.

Приклад від нашого клієнта помасштабнее: прочитувати свідчення електролічильників. У енергозбутових компаніях є спеціально навчені люди, які ходять по домівках і списують показання лічильників платників, а потім інші спеціально навчені люди ці свідчення вбивають в термінали. Купа людей абсолютно неефективно витрачає час.

Комп'ютерне зір дозволяє зробити цю процедуру вдвічі простіше: людина приходить, фотографує лічильник, система зчитує його номер і показання і автоматично вносить дані в базу.

Готовність: 9 Греф з 10 - можна відкрити майже будь-який додаток, яке підтримує переказ грошей з картки на картку, і переконатися в цьому.

Кейс 4: переводити з лікарського на російський

Реальний приклад від нашого замовника - розпізнавання почерку лікарів. Деякі види страховки припускають, що клієнту оплачуються не тільки послуги лікаря, а й ліки, які той виписав. Пацієнт фотографує рецепт, відправляє в страхову, фахівець дивиться і виносить вердикт - відшкодувати витрати на цей препарат або відмовити.

Проблема в тому, що часто фахівець просто не може розібрати написане в рецепті. Зате комп'ютерний зір, яке «побачитися» вже не один мільйон подібних рецептів, дозволяє розпізнавати лікарський почерк і перетворювати написане в читабельний текст ( «феназепам, 1 мг три рази на день протягом двох тижнів»).

Готовність: 7 Володарський з 10 - системи розпізнавання почерку вже існують.

Кейс 5: чи не затнутися про тригери

Брендам буває важливо, в якому контексті з'являється їх реклама. Припустимо, ви продаєте автомобілі. Ви оплатили ефір на Першому каналі в прайм-тайм або розміщення на YouTube - а ваш ролик показали відразу після новинного сюжету про страшну автокатастрофу або про те, що городяни втрачають в пробках по 10 років життя. Все, рекламний бюджет пішов коту під хвіст.

Зворотна ситуація: ви виробляєте льодяники від кашлю. Ви оплатили розміщення - і тепер ваш ролик показують, коли в фільмі хтось кашляє, або коли в новинах кажуть про чергову хвилю ГРЗ. Продажі злітають, ви потираєте руки.

Такий контекст можна відстежувати автоматично, аналізуючи відео- і звукоряд. Для цього досить навчити систему комп'ютерного зору (і слуху) і налаштувати тригери - після цього рекламу показуємо, а після ось того і не показуємо ні в якому разі.

Готовність: 1 Огілві з 10 - але це рівно до тих пір, поки не прийшов замовник. Всі напрацювання для створення такої системи вже є.

Кейс 6: роботизировать доктора Хауса

Дуже перспективна сфера використання комп'ютерного зору - охорона здоров'я. Комп'ютер можна навчити виглядати аномалії на рентгенівському знімку і прогнозувати перебіг хвороби. При цьому машина потенційно ефективніше людини. Супердосвідчений лікар-рентгенолог за роки практики побачить десятки, нехай навіть сотні тисяч знімків, при цьому далеко не всі кейси залишаться у нього в пам'яті.

Комп'ютера можна згодувати мільйони знімків разом з історіями хвороби. Помітивши аномалію на знімку, машина може знайти в цій величезній вибірці схожі випадки і дати прогноз динаміки. А ще такі системи можна використовувати у віддалених районах, куди досвідчені лікарі просто не добираються.

І це вже стає реальністю. У 2017 році штучний інтелект навчився діагностувати туберкульоз на рентгенівських знімках з практично стовідсотковою точністю.

А дослідники підрозділу Google DeepMind спільно з Національною службою охорони здоров'я Великобританії розробляють алгоритми, що дозволяють на ранніх стадіях діагностувати такі очні захворювання, як вікова макулярна дегенерація і діабетична ретинопатія (це одна з найпоширеніших причин сліпоти в світі). Для цього аналізуються мільйони томографічних знімків очей.

Готовність: 5 хаусів з 10. В деяких країнах подібні експерименти вже успішно проводяться. У Росії ж спершу потрібно впровадити цифрові медкарти і зібрати їх в одній базі.

Кейс 7: не дати гречці зникнути з полиць

Торгові точки з допомогою комп'ютерного зору можуть впровадити систему інтелектуального мерчандайзингу. Як працює мерчандайзинг з людським обличчям? Виробник або постачальник товару домовляється з точками продажу про те, що його продукт (наприклад, гречка) буде представлений в конкретних магазинах. З деякою регулярністю в ці магазини навідується мерчандайзер: перевіряє, чи варто крупа на полицях, скільки пачок залишилося на складі магазину. Якщо гречку розкупили або скоро розкуплять, поповнює запаси на складі. Пише звіт і робить аерофотознімки - «15 квітня 2018 року, гречка справно надходить на полиці, ось знімок», після чого їде в наступну точку продажів.

Разом: в одних точках склади і полиці ломляться від круп, але мерчандайзер все одно приїжджає з перевіркою. В інших магазинах гречка давно закінчилася, покупці страждають, але мерчандайзер про це не знає і доїде туди тільки через три дні.

Цю діяльність можна істотно оптимізувати за допомогою комп'ютерного зору. Навпаки прилавка встановлюється камера. Коли певний товар закінчується (наприклад, залишається три одиниці), система подає сигнал до підрозділу мерчандайзингу.

Приходить співробітник, виставляє товар, камера фіксує зміни - всі задоволені і щасливі. І нікому не потрібно постійно переміщатися з одного місця в інше, самостійно контролювати кількість товару, робити що підтверджують знімки.

Готовність: 10 Джеків Ма з 10. Система вже працює.

Кейс 8: тримати поставки під контролем

Промисловим підприємствам комп'ютерний зір може допомогти в обліку вивозиться великогабаритного вантажу. Як правило, цим займається окремий співробітник. Так-так, людина цілий день зайнятий виключно тим, що записує в блокнотик, яка машина скільки одиниць вантажу вивезла. Ту ж саму роботу можна робити за допомогою комп'ютерного зору - по фотографії або відео.

Готовність: 3 Ади Лавлейс з 10. Технології для цього є, можна реалізувати в будь-який момент.

Кейс 9: стежити, щоб в розетці завжди був струм

У Росії довжина ліній електропередач обчислюється, напевно, мільйонами кілометрів. Багато ЛЕП знаходяться у віддалених районах, в горах, тайзі, степи. Регулярно оглядати все людськими силами неможливо. Раніше діагностику проводили за симптомами: у всього селища пропала електрика - майстри виїжджають на пошуки несправності.

Зараз стан ЛЕП в таких районах моніторить вертоліт, оснащений камерами. Система комп'ютерного зору аналізує ступінь зносу і фіксує, які ділянки потребують техобслуговуванні (поправити похилений стовп, замінити дроти).

Готовність: 10 Едісонів з 10. Вже працює.

Кейс 10: не дати виробничому процесу зупинитися

А ще технологія може спростити і здешевити виробничі процеси. Наприклад, існують промислові рудні екскаватори. Щоб вони могли працювати навіть з найскладнішими породами, на зуби ковшів надягають супертвердих побідитові накладки. Такий екскаватор серед іншого вивантажує руду в Машина для подріблення, яка коштує десятки мільйонів доларів. Іноді побідитові накладка відламується. Якщо вона потрапляє разом з рудою в Машина для подріблення, остання виходить з ладу. Виробництво встає, а ремонт влітає підприємству в копієчку.

Рішення - установка камери на ківш: якщо в момент звільнення від руди вона фіксує, що не вистачає одного з зубів, двигун машини глушиться, працівники розуміють, що щось пішло не так, і починають розбиратися. Вдається уникнути поломки дорогої техніки і заощадити гроші і час.

Готовність: 10 Стаханова з 10. Є, працює.

Кейс 11: примірка для тих, хто ненавидить приміряти

Комп'ютерне зір здатне створювати доповнену реальність. У деяких магазинах вже реалізована можливість віртуальної примірки одягу: клієнтові більше не потрібно тягнути купу речей в примірювальну, стояти в черзі, роздягатися і одягатися - комп'ютер «одягне» вподобану одяг на людину і виведе на екран картинку.

Готовність: 9 Карл Лагерфельд з 10. Віртуальні примірочні вже існують.

Кейс 12: малювати, як художник

Комп'ютерне зір дозволяє створювати твори мистецтва. Приклад: машина проаналізувала всю наявну творча спадщина Рембрандта - манеру, образи, теми, колірну палітру, характер мазків. А потім з урахуванням всіх цих вступних згенерувала ще одну картину.

Готовність: 9 Рембрандтів з 10. Генерувати картини вже можна, єдина заковика - вартість їх поки нижче оригіналу.

Кейс 13: роздрукувати фото з Instagram на білборд

Також за допомогою технології можна у багато разів збільшити дозвіл і розмір зображення. Скажімо, ви хочете роздрукувати стару фотографію 10 * 15 в розмірі афіші. Ви скануєте фото, комп'ютер збільшує зображення, Домальовуючи відсутні пікселі по аналогії з сусідніми. На виході ви отримуєте чітку, яскраву, контрастну картинку. Спробувати технологію можна тут .

Готовність: 9 Енні Лейбовіц з 10. На білборд поки не потягне, але на афішу - цілком.

замість висновку

Технологічні продукти і бізнес рідко йдуть рука об руку: бізнес уникає довгої розробки і тривалих фінансових вкладень, в той час як наукомістких технологій тільки і потрібно, що вкладення і час. Технологія повинна дозріти до стану, коли її можна буде застосовувати в бізнесі майже відразу, «з коробки».

Бізнес повинен сформулювати замовлення - визначити для себе потребу в цій технології. І цей важливий етап становлення ринку відбувається прямо зараз.

Я абсолютно впевнений, що в найближчі кілька років рішення, засновані на технологіях комп'ютерного зору, стануть буденністю - як ручки на дверях або контекстна реклама, - а ця стаття буде такий же марною, як інструкція до пульта дистанційного керування.

Матеріали по темі:

Чому нас навчать роботи: п'ять технологій, які змінять EduTech

«Потрібно обов'язково знати IT, тому що це майбутнє і це в тренді»

Як захистити свій бізнес від хакерів, які використовують уразливості в додатках

Шість принципів, які зроблять вашу ідею запам'ятовується

Стартап Ossic зібрав майже $ 6 млн на VR-навушники через краудфандінг. І закрився

Знайшли друкарську помилку? Виділіть текст і натисніть Ctrl + Enter

Як працює мерчандайзинг з людським обличчям?