Обработка на естествен език
Отговорен изкуствен интелект и NLP

Изграждане на безопасни, фактически основани, справедливи и емпатични агенти с изкуствен интелект
Тъй като агентите с изкуствен интелект се използват широко в реални условия, осигуряването на тяхната безопасност, достоверност и справедливост е от решаващо значение. Отговорните системи с изкуствен интелект трябва не само да генерират точна и безпристрастна информация, но и да се противопоставят на злоупотребите и да балансират поддържащото взаимодействие с предпазните мерки срещу емоционална зависимост.
В INSAIT изучаваме отговорния изкуствен интелект от множество допълващи се гледни точки. Нашите изследвания обхващат откриване и смекчаване на социални предразсъдъци, откриване на халюцинации и проверка на достоверността на информацията, джейлбрейк и свързани с тях защити, както и съвместната оптимизация на емпатията, безопасността и достоверността на информацията.
Нашата скорошна работа предоставя цялостна рамка за оценка на социалните предразсъдъци който анализира социалните измерения и ефектите от квантуване само по тегло и активиране на теглото върху социалните пристрастия на LLM. С ChartAttack, фокусирайки се върху подвеждащи диаграми, разработихме рамка, оценяваща как мултимодалните модели на големи езици (MLLM) могат да бъдат злоупотребени за генериране на подвеждащи диаграми в голям мащаб, подчертавайки необходимостта от по-голяма устойчивост и съображения за сигурност при генерирането на диаграми, базирани на изкуствен интелект.
Преподаватели и ментори, участващи в тази изследователска област:
Ирина Гюревич
Юша Уанг
Усъвършенстване на езиковите модели

Стратегии след обучение и отвъд авторегресивните архитектури
Следобучението е ключов етап от разработването на големи езикови модели, насочен към подобряване на специфичните за задачите резултати и привеждане на моделите в съответствие с човешките ценности.
В INSAIT се фокусираме върху разбирането как често използваните методи за пост-тренировъчно обучение се сравняват и кога да ги използваме, например в Алетея.. Също така се интересуваме от подобряване на отделни компоненти на рецептата за LLM след обучение, за да балансираме разходите за обучение и производителността надолу по веригата, както и от нови архитектури за езиково моделиране, които надхвърлят чисто авторегресивното моделиране.
Преподаватели и ментори, участващи в тази изследователска област:
Проф. Ирина Гюревич
Д-р Юша Уанг
Лични дигитални близнаци

Непрекъснато обучаващи се агенти, които моделират потребителя
Личните дигитални близнаци са агенти с изкуствен интелект, които непрекъснато се учат от взаимодействията с потребителите, за да моделират индивидуалните предпочитания, знания и награди. Такива системи се стремят да се превърнат в персонализирани когнитивни разширения на индивидите, като улавят техните знания, модели на вземане на решения и ценности, за да им помагат, да си сътрудничат и да действат от тяхно име.
В INSAIT разработваме AI You, демонстрационна система, която се учи да имитира стиловете на реакция на потребителите, личните експертни знания и моделите на вземане на решения с течение на времето. Нашето изследване се фокусира върху непрекъснатото учене, дългосрочната памет и персонализацията при ограничения на поверителността.
Централната цел е да се справят с две основни пречки в разработването на AI агенти: (1) липсата на висококачествени авангардни експертни знания и специфични за приложението данни за оптимизация и (2) недостигът на надеждна обратна връзка за възнагражденията. Нашата ориентирана към потребителя парадигма допринася както с новогенерирана експертиза в областта, така и с персонализирани сигнали за възнаграждения от реални хора.
Преподаватели и ментори, участващи в тази изследователска област:
Д-р Юша Уанг