Strukturované vs. Nestrukturované
Strukturovaný a nestrukturovaný jsou dva typy dat nebo informací, které mezi sebou vykazují rozdíly, pokud jde o jejich koncepty a významy. Popis dat obsažených v polích se nazývá strukturovaná informace. Na druhou stranu všechny binární dokumenty se nazývají nestrukturované informace nebo data. Toto je hlavní rozdíl mezi strukturovaným a nestrukturovaným.
Strukturované informace se tak nazývají, protože jejich povaha a funkce jsou identifikovány značkami metadat. Na druhou stranu, některé z nejlepších příkladů dokumentů, které spadají pod nestrukturovaný typ dat nebo informací, jsou.pdf a.docx.
Je důležité vědět, že strukturované informace mají se SharePointem hodně společného. Říká se, že veškerý obsah vytvořený nebo vytvořený přímo na nebo v rámci SharePoint je považován za strukturovaný. Například všechny výpisy oblastí a položky seznamu, které jsou vytvořeny nebo vytvořeny přímo v SharePointu, spadají pod strukturovaný typ dat nebo informací. Toto je důležité pozorování, které je třeba učinit, pokud jde o definování strukturovaných dat.
Je třeba mít na paměti, že všechny binární dokumenty, které používají proprietární aplikace, jako je Acrobat nebo Word, spadají pod nestrukturovaný typ dat nebo informací. Nestrukturované informace jsou ve skutečnosti automaticky extrahovány pomocí aplikace IFilter nebo odpovídajícího převodníku. Toto je další důležitý rozdíl mezi strukturovanými a nestrukturovanými daty.
Samozřejmě je třeba mít na paměti, že odkazy na SharePoint se primárně používají pouze k indexování strukturovaných dat. K jinému účelu se nepoužívá. Jasné pochopení rozdílu mezi strukturovanými a nestrukturovanými daty nebo informacemi je pro softwarového experta naprosto zásadní v tom smyslu, že bude schopen správně kategorizovat soubory a data.