Software și aplicații gratuite pentru mineritul datelor cu sursă deschisă
Următoarele aplicații sunt disponibile sub licențe gratuite/open source. Accesul public la codul sursă al aplicației este, de asemenea, disponibil.
- Carrot2: cadru de grupare a textului și a rezultatelor căutării.
- Chemicalize.org: un miner de structuri chimice și un motor de căutare web.
- ELKI: un proiect de cercetare universitar cu analiză avansată de cluster și metode de detectare a valorii anormale scris în limbajul Java.
- GATE: un instrument de procesare a limbajului natural și de inginerie a limbajului.
- KNIME: The Konstanz Information Miner, un cadru de analiză a datelor ușor de utilizat și cuprinzător.
- Masive Online Analysis (MOA): o analiză în timp real a fluxului de megadate (big data) cu instrument de deriva conceptului în limbajul de programare Java.
- ML-Flex: un pachet software care permite utilizatorilor să se integreze cu pachete de învățare automată terță parte scrise în orice limbaj de programare, să execute analize de clasificare în paralel pe mai multe noduri de calcul și să producă rapoarte HTML ale rezultatelor clasificării.
- Biblioteca MLPACK: o colecție de algoritmi de învățare automată gata de utilizare, scrise în limbajul C++.
- MEPX – instrument multiplatformă pentru probleme de regresie și clasificare bazat pe o variantă de programare genetică.
- NLTK (Natural Language Toolkit): o suită de biblioteci și programe pentru procesarea simbolică și statistică a limbajului natural (NLP) pentru limbajul Python.
- OpenNN: deschide biblioteca de rețele neuronale.
- Orange: o suită de software de extragere a datelor și de învățare automată bazată pe componente, scrisă în limbajul Python.
- R: un limbaj de programare și un mediu software pentru calcul statistic, extragerea datelor și grafică. Face parte din proiectul GNU.
- seikit-learn: o bibliotecă open source de învățare automată pentru limbajul de programare Python
- Torch: o bibliotecă open source de învățare profundă pentru limbajul de programare Lua și cadrul de calcul științific, cu suport larg pentru algoritmii de învățare automată.
- UIMA: UIMA (Unstructured Information Management Architecture) este un cadru component pentru analiza conținutului nestructurat, cum ar fi text, audio și video – dezvoltat inițial de IBM.
- Weka: o suită de aplicații software de învățare automată scrise în limbajul de programare Java.
Software și aplicații proprietare de minerit a datelor
Următoarele aplicații sunt disponibile sub licențe proprietare.
- Angoss KnowledgeSTUDIO: instrument de minerit a datelor oferit de Angoss.
- Clarabridge: soluție de analiză a textului de clasă enterprise.
- Platforma HP Vertica Analytics: software de extragere a datelor furnizat de HP.
- IBM SPSS Modeler: software de minerit a datelor furnizat de IBM.
- KXEN Modeler: instrument de minerit a datelor oferit de KXEN.
- LIONsolver: o aplicație software integrată pentru minerit de date, business intelligence și modelare care implementează abordarea Learning and Intelligent Optimization (LION).
- Megaputer Intelligence: software-ul de minerit a datelor și a textului se numește PolyAnalyst.
- Microsoft Analysis Services: software de minerit a datelor furnizat de Microsoft.
- NetOwl: suită de produse de analiză de text și entități multilingve care permit mineritul datelor.
- OpenText™ Big Data Analytics: minerit vizual al datelor și analiză predictivă de către Open Text Corporation
- Oracle Data Mining: software de minerit a datelor de la Oracle.
- PSeven: platformă pentru automatizarea simulării și analizei ingineriei, optimizare multidisciplinară și mineritul datelor oferită de DATADVANCE.
- Qlucore Omics Explorer: software de minerit a datelor furnizat de Qlucore.
- RapidMiner: un mediu pentru experimente de învățare automată și mineritul datelor.
- SAS Enterprise Miner: software de minerit a datelor furnizat de Institutul SAS.
- STATISTICA Data Miner: software de minerit a datelor furnizat de StatSoft.
- Tanagra: un software de minerit a datelor orientat spre vizualizare, de asemenea pentru predare.
Sondaje de piață
Mai mulți cercetători și organizații au efectuat analize ale instrumentelor de minerit a daqtelor și sondaje ale mineritului de date. Acestea identifică unele dintre punctele forte și punctele slabe ale pachetelor software. Ele oferă, de asemenea, o imagine de ansamblu asupra comportamentelor, preferințelor și opiniilor minerilor de date. Unele dintre aceste rapoarte includ:
- Hurwitz Victory Index: Raport pentru analitica avansat ca instrument de evaluare a cercetării de piață, evidențiază atât diversele utilizări ale tehnologiei de analitica avansată, cât și furnizorii care fac posibile aceste aplicații. Cercetări recente
- 2011 Wiley Interdisciplinary Reviews: Data Mining and Knowledge Discovery
- Rexer Analytics Data Miner Surveys (2007–2013)
- Forrester Research 2010 Raportul Predictive Analytics and Data Mining Solutions
- Gartner 2008 Raportul “Magic Quadrant”
- Robert A. Nisbe (2006) Articole în trei părți “Data Mining Tools: Which One is Best For CRM?”
- Haughton et al. (2003) Review of Data Mining Software Packages în The American Statistician
- Goebel & Gruenwald 1999 “A Survey of Data Mining a Knowledge Discovery Software Tools” în SIGKDD Explorations
Sursa: Drew Bentley, Business Intelligence and Analytics. © 2017 Library Press, Licență CC BY-SA 4.0. Traducere și adaptare: Nicolae Sfetcu
© 2021 MultiMedia Publishing, Business Intelligence și Analytica în afaceri, Colecția Știința Informației
Lasă un răspuns