Докторант
Имейл: [email protected]
За мен
Антон Александров
Аз съм Антон Александров, докторант втора година в Института за компютърни науки, изкуствен интелект и технологии към Софийски университет от октомври 2023 г. Научен ръководител съм на проф. Мартин Вечев.
Основните ми изследователски интереси включват обработка на естествен език, многоезиково представяне, трансферно обучение, приложен машинен интелект и други.
В по-практичен план, BgGPT е проект, който започнах и продължавам да работя по него и в момента. Това е голяма инициатива за създаване на по-добри модели на български език и български NLP за научната общност и българското общество. Нашите отворени модели са свободно достъпни в нашата HuggingFace org и сме създали чат приложение, което превъзхожда в разбирането и генерирането на български език.
Образование:
- ETH Zurich, 10/2021 – 10/2023
Магистър по компютърни науки - University of Warwick, 10/2018 – 07/2021
Бакалавър по компютърни науки (Първа класа)
Публикации, публични изказвания
Антон Александров, Веселин Райчев, Марк Никлас Мюлер, Це Джан, Мартин Вечев, Кристина Тутанова
EMNLP 2024
Морис Вебер, Карло Зибеншу, Рори Бътлър, Антон Александров, Валдемар Таннер, Георгиос Цолакис, Харис Джабар, Иън Фостър, Бо Ли, Рик Стивънс, Це Джан
NeurIPS 2023
Морис Вебер, Даниел Фу, Куентин Антъни, Йонатан Орен, Шейн Адамс, Антон Александров, Сяожонг Лю, Хуу Нгуен, Сяоже Яо, Вирджиния Адамс, Бен Атиуараткун, Рахул Чаламала, Кежен Чен, Макс Рябинин, Три Дао, Пърси Лианг, Кристофър Ре, Ирина Риш, Це Джан
NeurIPS 2024
Рареш Константин; Мориц Дюк; Антон Александров; Патрик Матошевич; Дафна Кейдар; Менатала Ел-Асади
IEEE TREX 2022
Съответен трудов стаж
Opencode systems, Jul 2020 – Jul 2021
Инженер научноизследователска и развойна дейност
2024
Anton Alexandrov, Veselin Raychev, Mark Niklas Müller, Ce Zhang, Martin Vechev, Kristina Toutanova
Mitigating Catastrophic Forgetting in Language Transfer via Model Merging
2023
Maurice Weber, Carlo Siebenschuh, Rory Marshall Butler, Anton Alexandrov, Valdemar Ragnar Thanner, Georgios Tsolakis, Haris Jabbar, Ian Foster, Bo Li, Rick Stevens, Ce Zhang
WordScape: a Pipeline to Extract Multilingual, Visually Rich Documents with Layout Annotations from Web Crawl Data
In: Conference on Neural Information Processing Systems (NeurIPS 2023), Datasets and Benchmarks Track, 2023