Tantárgy neve: Szövegbányászat és dokumentum kezelés |
Tantárgy Neptun kódja: Nappali: GEIAL527M Tárgyfelelős intézet: INF - Informatikai Intézet |
Tantárgyelem: S_V1 2 tárgy választandó | |
Tárgyfelelős: Dr. Baksáné Dr. Varga Erika - egyetemi docens | |
Közreműködő oktató(k): - | |
Javasolt félév: 3 | Előfeltétel: |
Óraszám/hét: Előadás (nappali): 2 Gyakorlat (nappali): 2 | Számonkérés módja: kollokvium |
Kreditpont: 4 | Munkarend: Nappali |
Tantárgy feladata és célja: A szövegbányászat feladatának, alapelveinek és módszereinek megismerése szövegbányász szoftverek alkalmazásával. Tudás: Az informatikai szakmán belül, a specializációtól függően mélyebb elméleti és gyakorlati ismeretekkel rendelkezik az alábbiak közül egy vagy néhány területen: szoftvertervezés, rendszerszimuláció és -modellezés, kommunikációs hálózatok, mobil- és erőforrás-korlátos alkalmazások, számítógépes grafika és képfeldolgozás, kritikus és beágyazott rendszerek, médiainformatika, IT-biztonság, párhuzamos rendszerek, intelligens rendszerek, számításelmélet, adatbázisok. Képesség: Képes törvényszerűségeket, összefüggéseket feltárni és megérteni. A megszerzett tudást képes alkalmazni és a gyakorlatban hasznosítani. A rutinproblémák felismerésén és megoldásán túl képes eredeti ötleteket felvetni. Az információtechnológia eszközeit és formális módszereit készség szinten használja. Attitűd: Nyitott és elkötelezett az önművelésre, önfejlesztésre, az egyéni tudás, ismeret elmélyítésére, bővítésére a természettudományok, a mérnöki és informatikai tudományok területén. Munkája során vizsgálja a kutatási, fejlesztési és innovációs célok kitűzésének lehetőségét és törekszik azok megvalósítására. Munkáját kreatívan, rugalmasan végzi, a problémákat felismeri és azokat intuícióra és módszerességre építve oldja meg. Autonomia és felelősség: Felelősséget érez a határidők betartására és betartatására. Alkalmas csoportban, egy-egy részterület szakértőjeként dolgozni, valamint csoportot felelősséggel irányítani. | |
Tárgy tematikus leírása: A szövegbányászat feladata gyengén strukturált vagy strukturálatlan szöveges adatok feldolgozása, elemzése: információkinyerés dokumentumokból, dokumentumok osztályozása, csoportosítása, összegzéskészítés, kereséstámogatás. Ehhez felügyelt és felügyelet nélküli gépi tanulási módszereket, számítógépes nyelvészeti eszközöket és a szemantika reprezentálására alkalmas ontológiákat használunk. A gyakorlatban megismerjünk az R statisztikai elemző nyelv és az Oracle adatbáziskezelő rendszer szövegbányász moduljait. | |
Félévközi számonkérés módja és az aláírás megszerzésének feltétele (Nappali): 1 szövegelemzési feladat. Az aláírás megszerzésének feltétele a félévközi feladat elkészítése. | |
Félévközi számonkérés módja és az aláírás megszerzésének feltétele (Levelező): | |
Gyakorlati jegy / kollokvium teljesítésének módja, értékelése (Nappali): A vizsga írásbeli, értékelése: 0%-50%: elégtelen 51%-62%: elégséges 63%-75%: közepes 76%-88%: jó 89%-100%: jeles | |
Gyakorlati jegy / kollokvium teljesítésének módja, értékelése (Levelező): | |
Kötelező irodalom: 1. Tikk Domonkos (szerk.): Szövegbányászat (Az Informatika alkalmazásai sorozat), Typotex, 2007. 2. D. Jurafsky and J.H. Martin: Speech and Language Processing (3rd Edition), 2017, web.stanford.edu/~jurafsky/slp3/ 3. J. Silge and D. Robinson: Text Mining with R (A Tidy Approach), O'Reilly 2017, ISBN 978-1-491-98165-8 4. 5. | |
Ajánlott irodalom: 1. C.C. Aggarwal and CX. Zhai (eds.): Mining Text Data, Springer, 2012. 2. Srivastava, Ashok and Mehran Sahami (eds.): Text Mining: classification, clustering and applications, Chapman&Hall 2009. 3. C.D. Manning, P. Raghavan and H. Schütze: Introduction to information retrieval, Cambridge University Press, 2008. 4. 5. |