아부다비 첨단기술연구위원회(ATRC)의 응용 연구 기관인 기술혁신연구소(TII, Technology Innovation Institute)가 하이브리드 ‘맘바-트랜스포머(Mamba-Transformer)’ 아키텍처를 기반으로 구축된 새로운 거대언어모델(LLM) ‘팔콘-H1 아라빅(Falcon-H1 Arabic)’을 발표했다. 기존 트랜스포머 기반 버전에서 완전히 벗어난 이 신규 모델은 오픈 아라빅 LLM 리더보드(OALL, Open Arabic LLM Leaderboard)에서 최고 성능 시스템으로 등극했다.

팔콘-H1 아라빅 / 사진. 아부다비 TII
이 획기적인 성과로 팔콘-H1 아라빅은 현재 이용 가능한 최고의 아랍어 AI 모델이 되었다. 이 모델은 최첨단 정확도, 문맥 처리 및 언어적 표현력을 제공하면서도 수배 더 큰 모델들의 성능을 능가한다.
파이살 알 반나이(Faisal al Bannai) UAE 대통령 고문 겸 첨단기술연구위원회 사무총장은 “팔콘-H1 아라빅은 첨단 기술과 책임 있는 AI의 글로벌 허브로서 아랍에미리트의 입지를 강화하려는 지속적인 의지를 반영한다”며 “이 지역의 언어적·문화적 필요를 지원하는 모델을 제공함으로써 사회 전반에서 접근 가능하고, 유효하며, 영향력 있는 혁신을 가능하게 한다. 이 성과는 TII 내 인재의 깊이와 연구 전문성을 입증한다”고 말했다.
고품질 아랍어 LLM에 대한 커뮤니티의 확실한 수요를 입증하며 올해 초 출시된 ‘팔콘-아랍어’ 모델들의 큰 호응에 힘입어, TII는 새로운 팔콘-H1 아라빅 제품군으로 연구를 고도화했다. 30억(3B), 70억(7B), 340억(34B) 파라미터 크기로 제공되는 이 모델들은 다양한 인프라와 사용 사례 요구를 충족하도록 설계됐다.
팔콘-H1 아라빅은 데이터 품질, 방언 범위, 장문 컨텍스트 안정성, 수학적 추론 능력을 개선하여 실제 애플리케이션 전반에서 더 정확하고, 신뢰할 수 있으며, 맥락을 인식하는 아랍어 이해를 가능하게 한다.
나즈와 아라즈(Najwa Aaraj) TII 최고경영자(박사)는 “팔콘-H1 아라빅 개발은 수년간의 아랍어 AI 기초 작업을 바탕으로 개발자와 기업을 포함한 커뮤니티의 필요에 직접 부응한다”며 “아키텍처, 데이터 품질, 장문 컨텍스트 추론을 발전시킴으로써 교육, 의료, 거버넌스, 엔터프라이즈 등 다양한 분야에서 모두 아랍어로 새로운 가능성을 여는 원동력을 만들고 있다. 이 모델은 이 지역에 기여하고 글로벌 진전에 이바지하는 세계적 수준의 AI를 제공하려는 우리의 사명에서 중요한 발걸음”이라고 밝혔다.