Tagged: koneluettava
Puolustusvoimien aikakone kaatui – ja nousi
Elämme kiihkeästi verkottuvassa maailmassa, jossa ihmisten lisäksi koneet ja ohjelmat alkavat viestiä keskenään omatoimisesti. Vasta murto-osa luomastamme tiedosta on digitoitu ja siitä murto-osa on rakenteistettu koneen ymmärtämään muotoon. Rakenteinen, koneluettava tieto on koneoppimisen ruokaa. Tietoa voidaan rakenteistaa ihmisen toimesta, mutta myös automaattisesti, tuloksena semanttinen internet.
Viime vuosina tietokoneet (ei vain supertietokoneet vaan meidän jokaisen puhelimemme) ovat saaneet näkö-, kuulo- ja liikeaistin sekä paikkatietoisuuden. Pilvipalveluihin kertyy joka hetki mediaa, joka on jo joko automaattisesti luokiteltu, tai on nopeasti algoritmien käsiteltävissä. Tuntuu siltä, että Terminator-elokuvan Skynet todella kohta herää henkiin – jos ei jo ole sitä tehnyt ja pysyy viisaasti piilossa.
Nyt onkin hyvä hetki julkaista uudelleen ihka ensimmäinen blogijuttuni muutaman vuoden takaa ja hieman täydentää sitä. Tässä alkuperäisteksti:
“Eilen, 25.4.2013 Puolustusvoimat avasi valtavan kuva-arkistonsa internetin kautta kaiken kansan käytettäväksi. Kyseessä on avoimen datan hengessä toteutettu merkittävä kulttuuriteko, jolla on aiheesta johtuen monille myös suuri inhimillinen merkitys.
www.sa-kuva.fi joutui ystävällismielisen palvelunestohyökkäyksen kohteeksi ja tukkeutui saman tien. Voi kuulla, kuinka palvelimet ovat huutaneet “ne jyrää meitin!” Ripeällä vastaiskulla sivusto saatiin kuitenkin jo seuraavaksi päiväksi jaloilleen.
Muutama vuosi sitten etsin kuva-arkistosta Sörnäisissä kuvia isoisäni kaatumispäivältä. Kuvia koskeva metadata eli sodanaikaiset kuvaselostukset on arkistoitu kymmeniin mappeihin aika- ja maantieteelliseen järjestykseen. Jokaisella kuvalla on juokseva numero, jonka perusteella siitä löytyy mikrofilmi. Neljän tunnin työn tuloksena löysin muutamia kuvia, jotka sain rompulle skannattuna postitse parin viikon päästä.
Tänä aamuna kirjoitin saman päivämäärän kuva-arkiston hakukriteeriksi. Kymmenessä sekunnissa sain eteeni aiemmin löytämäni kuvat ja paljon muita.
Arkiston ja kuvaselostusten digitalisointi päivitti hakutekniikkaa 70 vuotta, nopeutti tiedon haun tunneista silmänräpäykseen ja vapautti arkistokaappeihin lukitun tiedon satojen tuhansien kiinnostuneiden käsiin.
Kuvat voi tallentaa itselleen ja joka kuvalla on oma URL-osoite. Niillä voi siis kuvittaa esityksiä, sukututkimuksia, upottaa digitaalisiin karttoihin tai Google Earthiin, luoda vaikka mitä.
Yhdessä muiden sähköisten arkistolähteiden, mm. digitoitujen sotapäiväkirjojen, kaatuneiden tietokannan jne kanssa kuva-arkisto muodostaa todellisen aikakoneen. Myös siinä mielessä, että tiedän minne omaa aikaani tulee vastedes menemään!” (alkup. tekstin loppu)
Näitä tietolähteitä yhdistellen onnistuin selvittämään isoisäksi epäilemäni kaatuneen, josta kuvassa näkyi vain saappaat, henkilöllisyyden. Asiassa auttoi ihmismielen kyky tunnistaa sattumalta sota-arkiston kirjahyllystä silmään pistänyt, kyseisen valokuvan ottaneen tk-kuvaajan muistelmateos, jossa kuvan taistelusta ja tilanteesta kerrottiin usealla sivulla. Kuvassa ei ollut isoisäni, mutta tälläkin kaatuneella oli useita lapsia, kuten tietokanta kertoi.
Muutama vuosi on kulunut, ja semanttisen datan hankkeessa Linked Data Finlandissa on toteutettu Sotasampo.fi-palvelu, joka yhdistää juuri nuo mainitsemani tietolähteet koneen ymmärtämällä tavalla ihmisen hyväksi. Aikakone on taas askelta kehittyneempi.
Hyödyntämättä on vaikka mitä tietoa, esimerkiksi digitoitujen sotapäiväkirjojen sisältö. Edistynyt OCR-tekniikka osannee lukea usein hyvällä käsialalla pidettyä, skannattua tekstiä. Tai sotahistorian harrastajat voisi joukkoistaa lukemaan sotapäiväkirjat älypuhelimelleen, joka osaa muuttaa puhutun tekstin sähköiseksi.
Kun vaikkapa Saksan ja ties jopa joskus Venäjän vapauduttua näiden arkistot saadaan yhteensopivalla koneiden kielellä indeksoitua, aukeaa taas uusia näkökulmia menneisyyteemme.
Vastaavia inhimillistä, kulttuurista, taloudellista tai vaikka juridista hyötyä tuottavia tietolähteitä avautuu koko ajan (ks. avoindata.fi). Kaikki maailman tiedot yhtykää!
Ylläoleva kuva: Amerikkalainen parikymppinen Jared Lenos värittää SA-kuvan kuvia uskomattoman taitavasti. Lisää Jaredin töitä täällä.