Само на 18, Делян Бойчев вече се занимава с това как невронните мрежи да „виждат“ по-добре и как да разпознаваме фалшивите снимки. Пред дванайсетокласника от Природо-математическата гимназия „Васил Друмев“ във Велико Търново все още стои предизвикателството матура. Делян е сигурен, че иска да се занимава с наука. Вярва, че България може да е силна в обучението за високите технологии.
Защото му станало скучно да създава сайтове – така Делян Бойчев обяснява защо се насочил към изцяло теоретичното ниво, свързано с математиката и статистиката.
„Когато започнах с обикновени уеб сайтове, ходих на националната олимпиада по информационни технологии, на други състезания, там се запознах с други хора, мои връстници, които видях, че се занимават и с това машинно обучение. Бях стигнал с разработването на уебсайтове до някакъв връх, просто нямаше какво да се подобри повече. Беше изключително дразнещо, скучно да се занимавам с правенето на сайтове. Реших да видя нещо ново. Приятели ми предложиха един курс, който изкарах за няколко седмици“, спомня си Делян в интервю за Българското национално радио.
След това се записал в лятна изследователска школа към Ученическия институт по математика и информатика към БАН, ментор му бил Христо Тодоров, който в момента учи в Станфордския университет. В последствие работил и с Кристиян Георгиев, който е докторант в Масачузетския технологичен институт. Георги Игнатов пък му дал началото като учител. Продължил сам, „защото стана изключително сложно“ и трябвало да чете „много повече, отколкото обикновено“. Така Делян стигнал до разработката на алгоритми. Първият алгоритъм бил упражнение – можел да разпознава деменцията по снимки.
„Тогава си зададох въпроса: „Добре, аз не виждам голяма разлика между двете изображения и не разбирам, защото аз не се занимавам с това. И си зададох въпроса как всъщност моделът го разпознава?“
Което го довело до другите му два проекта – за компютърното зрение и разпознаване на фалшиви снимки.
„Машинно обучените модели са изключително комплексни. Техните решения са един вид черна кутия за нас. Ние не може да разберем как тези модели вземат решението. Целта на този проект е да видим върху кои части от изображението се фокусира моделът, когато класифицира изображението. Да кажем, имаме тигър. Моделът се фокусира върху специфичните ивици. Един стандартен модел се фокусира върху случайни части от изображенията, които нямат никакъв смисъл за нас. Едно от приложенията на такива модели е в автономните автомобили. Например, имаме разпознаване на знаците. Да си представим, че имаме стикер на този знак. Този стикер може да подведе модела и да не разпознае знака изобщо, например, знак „стоп“ на кръстовището може да доведе до ПТП. Когато ние разберем, че моделът е пристрастен към този стикер, той му пречи, имаме възможност да променим, да подобрим модела.“
„Новият ми проект е за разпознаване на фалшиви снимки, генерирани от новите дифузори и генеративни модели. Това е много важно на първо място, защото имаме някои платформи, които имат авторски права. Много е важно да разберем откъде произлиза това изображение. Да кажем, платформа за продаване на изкуството – те имат за цел да мотивират хора, които наистина създават изкуство, а не хора, които са си го генерали с такъв модел. Също е толкова важно заради разпространяването на фалшиви новини с фалшиви снимки, при правенето на дийп фейк. Когато искаме да модерираме социалните мрежи, там също е приложимо. Целта на модела не е да разпознава какво има като съдържание в снимката, колко добре рисува, а по-скоро някакви други специфични черти, оставени от модела“, пояснява Делян Бойчев.
Обучението става чрез търсене на „шума“ във фалшивите снимки, обяснява 18-годишният младеж. Този повтарящ се всички изкуствено гарирани изображения модел остава невидим за хората, но е важен за изследователите. „Предполагам, звучи като научна фантастика, но всъщност е изключително. Не е просто, но е изцяло теоретично, няма никакви фантастични методи, нещо, което да не е доказано. Това са чисто статистически методи. Доста от тях даже са измислени през петдесетте години на ХХ век. Тогава започва развитието. Просто тогава не са имали изчислителна сила, данни в дигитален формат. Това е нямало как да се случи тогава. Но първата невронна мрежа е създадена през петдесетте години. След 2010-та година започва пикът, бумът на машинното обучение, когато се открива, че видеокартите помагат. По-бързо извършват изчисления, отколкото стандартен процесор. И тогава вече хората могат да тренират такива големи, големи невронни мрежи.“
Много внимателно Делян Бойчев борави с определението на невронните мрежи като изкуствен интелект.
„Изкуственият интелект за мен не звучи много етично. Като цяло и самата дума е специфична. Теоретично изкуственият интелект е машинно обучение или дълбоки невронни мрежи и дълбоко машинно обучение.“
Но се радва, че в специализираните българските училища се появява специалност, посветена на изкуствения интелект. „Не е за всеки. Може би трябва да има такъв предмет, който да запознава обществото как да работим с такива модели, как точно да ги използваме и какво да знаем за тях. Да не се плаши обществото това, че е някаква научна фантастика. Напротив, то не е научна фантастика. Сега влиза програма, доколкото знам, изкуствен интелект, професионална паралелка, където се изучават тези неща – как да се обучават такива модели. Което е много хубаво, но въпреки всичко смятам, че е изключително трудно. Ще има много интерес, но трябва и много добра подготовка на учителите. Повечето от учителите не са работили с това. Трябват преподаватели от университета, ще е много трудно да се осъществи тази връзка. Ще трябват много такива научни работници, а повечето от тях също имат доста други задължения освен това. Предполагам, няма да има достатъчно кадри за момента. Това е плюсът да остана в България -да допринеса евентуално някой ден аз да подпомогна България в развитието на тази област.“
Делян Бойчев вярва, че с традициите в информатиката и със съществуващите Институт по математика и информатика към БАН, и ИНСАЙТ към Софийския университет „България може да стане водеща сила в науката в тази област, ако всички работим за това“.
Дори статистиката в неговия клас да показва, че не всеки би имал интерес към невронните мрежи. „Двама човека сме – аз и още едно момче, които имаме интерес. От 24 човека. За съжаление, малка част от хората стават учени. Това, което ме накара всъщност, е любопитството ми към нещата и към света. Предпочитам да правя нещо, в което аз съм неограничен. Могат да правя хипотези и на базата на тези хипотези да правя експерименти, които да доказвам. Това ми дава удовлетворение, когато изследвам различни неща, които досега не са били изследвани.“
„Никога не става от първия път, особено пък, когато правим хипотези и експерименти. Даже е силно вероятно да попаднеш в задънена улица. Случвало ми се и това лято, и миналата година“, признава амбициозният младеж и съветва съмишлениците си: „Да бъдат упорити във всички случаи. Изключително любопитни и креативни, което е много важно за науката. Да не подценяват теоретичната си подготовка, защото ако подцениш теоретичната си подготовка, това също може да изиграе лоша шега. В училище времето е ценно. Ние имаме профилирана математика – тази математика я смятам за изключително полезна. Точно в машинното обучение се прилага математическият анализ. Тя ти дава една стабилна основа в последствие да продължиш. Всяко нещо, което се прави в училище, има някакво значение. В момента новата програма е доста по-добра от предишните стара програма, защото по математика се включват много по-полезни неща, по-важни, които те подготвят за университет. Аз искам да се занимавам с наука, ще си продължа това, но не мисля, че трябва да си подражаваме. Всеки е абсолютно индивидуален по характер. Всеки се занимава с различни неща, всеки има различни интереси. Не мисля, че искам да поддържам конкретно някого.“