
Корпорация Informatica пусна парсер за данни HParser за Hadoop, програмната рамка с отворен код за обработка на големи количества информация. Синтактичният анализатор може да трансформира неструктурираните данни в по-структурирана форма, за да бъдат използвани в Hadoop. HParser включва набор от библиотеки за различни типове данни – от стандарти като XML до индустриално специфични формати като HIPAA в здравеопазването или ASN.1 в телекомуникациите.
Продуктът идва в три издания, две от които са комерсиални – HParser Industry Standards и HParser for Documents, а другото в community версия, която е безплатна, но за премиум услуги и добавки се заплаща. Също така Informatica обяви, че community версията на HParser ще бъде налична за употреба и ще може да се сваля от сайта на Hortonworks, която е част от Yahoo.
Според Дейвид Менингър, вицепрезидент и директор за проучванията във Ventana Research, една от големите пречки пред Hadoop е, че много ИТ компании нямат уменията да започнат да работят с рамката, но HParser може да помогне за преодоляването на това препятствие. “Използването на графична среда за разработването на тези процеси би трябвало да улесни и ускори създаването на кода, необходим за статистическия анализ на данните.
HParser идва скоро, след като през юни Informatica пусна Hadoop конектор, адресиращ местенето на данни към и от Hadoop клъстер. Hadoop се превърна в една от технологиите с най-висок профил, асоциирани с така наречените „големи данни“, модерната фраза, описваща големи количества неструктурирана информация, генерирана от уеб сайтове, сензори, мобилни устройства и други нерелационни източници.

English
Моля,