Założeniem ogólnym CLARIN-PL-BIZ było wsparcie strategicznych projektów infrastruktury badawczej, wpisanych na Polską Mapę Infrastruktury Badawczej. Działania w projekcie polegały na udostępnianie zasobów językowych oraz elektronicznych narzędzi do automatycznego przetwarzania języka naturalnego badaczom we wszystkich dyscyplinach naukowych, a w szczególności z dziedziny nauk humanistycznych i społecznych. Liczba dokumentów dostępnych przez Internet i w innych formach elektronicznych (artykułów prasowych, archiwów cyfrowych, tekstów reklamowych, blogów itp.) stale rośnie. Dynamiczny przyrost cyfrowego materiału tekstowego jest cennym źródłem badań, ale tworzy równocześnie szereg wyzwań przed naukowcami. Zadaniem CLARIN było ułatwienie dostępu do opracowanych narzędzi i zasobów językowych oraz wspieranie zastosowań technologii językowych w naukach humanistycznych i społecznych.
Celem bezpośrednim projektu CLARIN-PL-BIZ było rozszerzenie infrastruktury badawczej CLARIN-PL do platformy badawczo-rozwojowej przeznaczonej do przetwarzania języka naturalnego i eksploracji wielkich danych językowych. Powstała dzięki temu rozbudowana infrastruktura do konstrukcji skutecznych i wydajnych systemów eksploracji wielkich danych językowych (tekstów i mowy). Zapewnia ona dostęp do uniwersalnych komponentów technologii językowej oraz mechanizmów ich łączenia na potrzeby konstruowania systemów analizy tekstu.
Realizatorami projektu byli:
- Politechnika Wrocławska (w tym WCSS),
- Instytut Podstaw Informatyki PAN,
- Instytut Slawistyki PAN,
- Uniwersytet Łódzki,
- Uniwersytet Wrocławski.