Data Mining în mediul R. Teorie și aplicații

Autor

Anul apariției

ISBN

978-606-34-0433-7

Format

17/24 cm

Număr pagini

191

La achiziția acestei cărți de pe site-ul Editurii ASE se va aplica un discount de 16% pentru toți cei care au conturi de site cu adrese de e-mail din domeniul @ase.ro

43,50 lei

Lucrarea de față, intitulată Data Mining în mediul R. Teorie și aplicații, este structurată pe 11 capitole, fiind concepută cu scopul de a constitui un ghid util atât pentru cercetători, cât și pentru practicieni, în vederea cunoașterii unor aspecte mai mult sau mai puțin analitice referitoare la domeniul Data Mining.

Procedura recunoscută sub denumirea de Data Mining se poate defini, în sens larg, drept o activitate ce presupune căutarea, colectarea și analiza datelor.

Lucrarea este recomandată atât studenților care au în planul de învățământ disciplinele Analiza Datelor, Data Mining sau Rețele neuronale artificiale (RNA), cât și cercetătorilor, doctoranzilor și celor interesați de aspecte cât mai variate legate de explorarea datelor.

Clear
Tip carte: Alege din variantele disponibile

Procedura recunoscută sub denumirea de Data Mining se poate defini, în sens larg, drept o activitate ce presupune căutarea, colectarea și analiza datelor.

Cantități însemnate de date pot fi colectate din surse variate, precum diverse baze de date sau site-uri web. Forma sub care sunt regăsite aceste date poate fi aceea a unor corelații sau pattern-uri, iar odată cu inovațiile și progresul tehnologic, extragerea acestor date a devenit din ce în ce mai simplă.

La nivel de companie sau de industrie, datele au devenit o resursă extrem de importantă. Extragerea unor informații utile din surse de date neorganizate constituie o activitate din ce în ce mai populară, grație tehnicilor actuale de Data Mining, care permite transformarea datelor primare în informații valoroase.

Lucrarea de față, intitulată Data Mining în mediul R. Teorie și aplicații,
este structurată pe 11 capitole, fiind concepută cu scopul de a constitui un ghid util atât pentru cercetători, cât și pentru practicieni, în vederea cunoașterii unor aspecte mai mult sau mai puțin analitice referitoare la domeniul Data Mining.

Primul capitol al acestei cărți este dedicat prezentării unei scurte introduceri în latura analizei de text (Text Mining) și implementării acesteia în mediul de programare R. Ulterior, o etapă extrem de importantă în contextul analizei de tip Text Mining, respectiv preprocesarea datelor este detaliată în cadrul celui de-al doilea capitol. Capitolele 3 și 4 urmăresc expunerea analizei de tip cluster, respectiv analizei de sentiment în contextul Text Mining. În cel de-al cincilea capitol este tratată problematica arborilor de regresie și arborilor de clasificare. Capitolul 6 este dedicat prezentării unor metode populare și extrem de utile de Data Mining, respectiv metodelor de tip ansamblu: bagging, boosting și stacking. În cadrul celui de-al șaptelea capitol este evidențiată comparația dintre metodele
de tip ansamblu bagging și boosting. Modelele de tip ansamblu vor fi abordate și în capitolele 8, respectiv 9, în contextul clasificării, respectiv regresiei. Procedurile bagging și AdaBoost vor fi detaliate astfel atât în cazul clasificării, cât și în contextul regresiei. Penultimul capitol urmărește detalierea construirii unor modele precum C5.0, Stochastic Gradient Boosting, Bagged CART, respectiv Random Forest în mediul R, în timp ce capitolul 11 expune o serie de aplicații utilizând metodele de tip ansamblu, constituite pe baza unor tehnici precum: analiza în componente principale (ACP), Rețelele Neuronale Artificiale, arborii de decizie, Random Forest sau SVM.

În consecință, lucrarea Data Mining în mediul R. Teorie și aplicații este recomandată atât studenților care au în planul de învățământ disciplinele Analiza Datelor, Data Mining sau Rețele neuronale artificiale (RNA), cât și cercetătorilor, doctoranzilor și celor interesați de aspecte cât mai variate legate de explorarea datelor.