dc.contributor.advisor |
Král, Erik
|
|
dc.contributor.author |
Holík, Radovan
|
|
dc.date.accessioned |
2013-10-09T00:31:34Z |
|
dc.date.available |
2013-10-09T00:31:34Z |
|
dc.date.issued |
2012-02-24 |
|
dc.identifier |
Elektronický archiv Knihovny UTB |
cs |
dc.identifier.uri |
http://hdl.handle.net/10563/22774
|
|
dc.description.abstract |
Tato práce spočívá ve studiu typů souborů obsahující textová data za účelem vývoje systému, který je schopen automaticky klasifikovat soubory. Hlavním cílem práce je automatické třídění souborů obsahující textová data bez podpory informací poskytnutých od souborového systému. V teoretické části je vysvětleno, jak obvykle pracují nástroje pro obnovu dat a Computer Forensics, dále je diskutován problém ohledně stanovení typu fragmentované části souboru. To je často hlavním tématem pro aplikace Computer Forensics. Mimo jiné, vyhledávání řetězců je obzvláště důležité, protože velmi často je důkaz hledán uvnitř textových dokumentů. Dále je v této části také popsána vnitřní struktura souborů PDF a Office XML. Praktická část obsahuje informace o implementaci softwarového nástroje, který je schopen z poskytnutého bloku dat získat informace, které mohou být použity pro automatickou klasifikaci dokumentu. |
cs |
dc.format |
76 |
cs |
dc.format.extent |
1588562 bytes |
cs |
dc.format.mimetype |
application/zip |
cs |
dc.language.iso |
en |
|
dc.publisher |
Univerzita Tomáše Bati ve Zlíně |
|
dc.rights |
Bez omezení |
|
dc.subject |
Computer Forensics
|
cs |
dc.subject |
klasifikace fragmentovaných souborů
|
cs |
dc.subject |
PDF
|
cs |
dc.subject |
Office XML
|
cs |
dc.subject |
Computer Forensics
|
en |
dc.subject |
File-fragment Classification
|
en |
dc.subject |
PDF
|
en |
dc.subject |
Office XML
|
en |
dc.title |
Automatické klasifikace souborů na základě rozpoznávání textových bloků |
cs |
dc.title.alternative |
Automatic File Classification Based on Text-data Blocks Recognition<br> |
en |
dc.type |
bakalářská práce |
cs |
dc.contributor.referee |
Vařacha, Pavel |
|
dc.date.accepted |
2012-06-20 |
|
dc.description.abstract-translated |
The thesis consists in the study of file types containing textual data for the purpose of developing an automatic file classification system. The main goal of the thesis is the automatic classification of files containing textual data without the support of the information provided by the file system. In the first part is explained how data recovery tools typically work and is discussed the problem of determining the encoding type of a file fragment. This is an important issue for Computer Forensics applications. Among these, string search is particularly relevant since very often crime evidence is searched within textual documents. In addition is described the internal structure of PDF and Office XML-based files. The analysis contains information about implementation of a software tool able to extract from a block of data the features that can be used for automatic classification of the document. |
en |
dc.description.department |
Ústav automatizace a řídicí techniky |
cs |
dc.description.result |
obhájeno |
cs |
dc.parent.uri |
http://hdl.handle.net/10563/90
|
cs |
dc.parent.uri |
http://hdl.handle.net/10563/220
|
cs |
dc.thesis.degree-discipline |
Informační a řídicí technologie |
cs |
dc.thesis.degree-discipline |
Information and Control Technologies |
en |
dc.thesis.degree-grantor |
Univerzita Tomáše Bati ve Zlíně. Fakulta aplikované informatiky |
cs |
dc.thesis.degree-grantor |
Tomas Bata University in Zlín. Faculty of Applied Informatics |
en |
dc.thesis.degree-name |
Bc. |
cs |
dc.thesis.degree-program |
Inženýrská informatika |
cs |
dc.thesis.degree-program |
Engineering Informatics |
en |
dc.identifier.stag |
26665
|
|
utb.result.grade |
A |
|
dc.date.submitted |
2012-06-08 |
|
local.subject |
textová analýza
|
cs |
local.subject |
kontextuální analýza
|
cs |
local.subject |
klasifikace
|
cs |
local.subject |
texty
|
cs |
local.subject |
plagiáty
|
cs |
local.subject |
textual criticism
|
en |
local.subject |
contextual analysis
|
en |
local.subject |
classification
|
en |
local.subject |
texts
|
en |
local.subject |
plagiarism
|
en |