Location via proxy:   [ UP ]  
[Report a bug]   [Manage cookies]                
SlideShare a Scribd company logo
Alkumotto:
Mieli kielen sanoittaa, kokemus kielenkannan kirvoittaa
Virpi Hotti
https://fi.linkedin.com/in/virpihotti
Citizen data science muuttaa julkishallintoa
Agenda
• Tieto, tiede, motivaatio ja citizen
data science
• Kokonaisarkkitehtuuri ja tiedolla
johtaminen sekä uudistettu JHS
179
• Kaksikätisyydellä selkeyttä
johtamiseen
• Näkemykset (insights) tulevat
• Miten citizen data scientist
pääsee konkreettisesti
eteenpäin?
”Näkemyksellinen citizen data science
muuttaa julkishallintoa eli citizen
datatieteilijät osaavat navigoida
analytiikka- ja indikaattorizoossa sekä
muodostavat tai muodostuttavat
liiketoimintamalleja tukevia
käyttökelpoisia näkemyksiä”
Agenda
• Tieto, tiede, motivaatio ja
citizen data science
• Kokonaisarkkitehtuuri ja tiedolla
johtaminen sekä uudistettu JHS
179
• Kaksikätisyydellä selkeyttä
johtamiseen
• Näkemykset (insights) tulevat
• Miten citizen data scientist
pääsee konkreettisesti
eteenpäin?
Google-kuvahaku: JasonGoto
Tieto
• ”Suomen kielessä tiedolla voidaan
tarkoittaa dataa, informaatiota tai
oppimisen ja kokemuksen kautta
muodostuvaa tietämystä” (JHS 179)
• “Knowledge is the theoretical
paradigm, the what to do and
the why. Skill is the how to do. And
desire is the motivation, the want to
do. In order to make something a
habit in our lives, we have to have all
three.” (The 7 Habits of Highly Effective
People: Powerful Lessons in Personal Change)
Kuvan lähde: https://www.pursuant.com/blog/redefining-fundraising-data/
Google-kuvahaku: JasonGoto.
Tiede
• “Science in its original sense is a
word for a type of knowledge . . . In
particular it is one of the types of
knowledge which people can
communicate to each other and
share”
(https://en.wikipedia.org/wiki/Science)
• Ilkka Niiniluodon mukaan
filosofiassa eli viisaustieteeteessä
on jotain pysyvää eli ”Ainakin hyvät
argumentit ja hyvät käsitteet, ja
kyllä se tietokin pikkuhiljaa
karttuu” (HS, 12.3.2016)
Google-kuvahaku: JasonGoto.
Motivaatio
• 16 perusmotiivia Steven Reissin
mukaan: valta, riippumattomuus,
uteliaisuus, hyväksyntä, järjestys,
säästäminen/kerääminen, kunnia,
idealismi, sosiaaliset kontaktit, perhe,
status, kosto/voittaminen,
esteettisyys, syöminen, ruumiillinen
aktiivisuus, rauhallisuus/mielenrauha
• Suomessa 11 % on sitoutuneita
työhönsä, 13 % pistää kapuloita
rattaisiin ja sabotoi tavoitteisiin
pääsyä (MMA 2/2016)
Lähde: http://thumbs.dreamstime.com/z/maslow-pyramid-theory-needs-21205277.jpg
Kuvan lähde: https://www.gartner.com/newsroom/id/3114217
Hype Cycle
Report of
Emerging
technologies
(Gartner
2015) – Big
Data putosi
ja tilalle
siihen
liittyviä
“teknologioi
ta” kuten
Citizen Data
Science
Gartnerin määritelmät datatieteilijöille
• Citizen data scientists are “people on the
business side that may have some
data skills, possibly from a math or
even social science degree—and
putting them to work
exploring and analyzing data”
• “The data scientist role is critical for
organizations looking to extract insight
from information assets for “big data”
initiatives and requires a broad
combination of skills that may be fulfilled
better as a team, for example:
Collaboration and team work is required
for working with business stakeholders to
understand business issues. Analytical
and decision modeling skills are required
for discovering relationships within
data and detecting patterns. Data
management skills are required to build
the relevant dataset used for
the analysis.”
Lähteet: http://www.kdnuggets.com/2015/08/gartner-2015-hype-cycle-big-data-is-out-machine-learning-is-in.html ja
https://www.gartner.com/it-glossary/data-scientist/
Datan auki avaaminen (eli analytiikka) on ensisijaisesti
yhteenvetojen tekemistä datajoukon ominaisuuksista
Kuvan lähde: Hotti V., Gain U., Lintula H., Puumalainen A., Salomaa H.: Construction of business-driven capta processing. The
3rd Virtual International Conference on Advanced Research in Scientific Areas (ARSA-2014) Slovakia, December 1 - 5, 2014.
“Data exploration is
the first step in data
analysis and
typically involves
summarizing the
main characteristics
of a dataset.”
http://searchbusinessanalytics.techtarget
.com/definition/data-exploration
Ja Pareton periaate pätee täälläkin…
Lähde: http://community.lithium.com/t5/Science-of-Social-blog/Big-Data-Reduction-1-Descriptive-Analytics/ba-p/77766
Citizen data scientist on digitaalinen isännöitsijä?
Lähde 25.3.2016: http://www.tivi.fi/Kaikki_uutiset/ai-mukamas-
kuuma-it-duuni-edelleen-pelkka-digitaalinen-talonmies-6535738
Lähde: Advanced Business Analytics Course Notes, SAS Institute.
Citizen data science kulmakivet
• Yksilön/yhteisön ymmärryksen lisääntyessä
kognitiosta siirrytään toimintaan. Se
tarkoittaa mm. (liike)toiminnan kannalta
merkityksellisien, dataan perustuvien
ratkaisuehdotuksien tekemistä ja niiden
toteuttamista
• Analytiikka kuuluu kaikille ja sen tulee olla
helposti lähestyttävää (approachable)
• Data-analytiikan avulla tuotetaan eri
toimialoilla toimiville organisaatioille
käyttökelpoisia/käytännönläheisiä
näkemyksiä (actionable insights)
• Monimuotoisia datajoukkoja kuvaillaan ja
yhdistetään sekä visualisoidaan sekä
hyödynnetään ohjaamatonta (unsupervised)
tai ohjattua (supervised) koneoppimista
(machine learning), johon liittyy myös
syväoppiminen (deep learning)
• Koko ajan on mietittävä, mitä arvoa datalla on
ja kenelle sekä millä viiveellä (millisekunneista
vuosiin)
Data
Data models,
advanced
analytics and BI
tools, etc.
Business
Business
models, key
questions,
indicators, etc
People
Decision models,
experiences, etc.
Liiketoiminta- ja/tai toimialaosaamista tarvitaan
tulosten tulkinnassa (paikkaansapitävyys ja
oikeellisuus)
Lähde: https://en.wikipedia.org/wiki/Accuracy_and_precisionLähde: http://www.mathsisfun.com/accuracy-precision.html
Abreu “Grindaa ja flowaa” ja datatieteteilijät
“Blendaa ja advaa” . . .
Source:
http://pages.alteryx.com/rs/alteryx/images/Data%20Blending%20For%20Dummies%20by%20Wiley%20-
%20from%20Alteryx.pdf
“can data scientists be replaced by
a general data science machine? A
number of vendors are betting big
that it can. Managers across the
world are hoping they are right.”
(https://www.linkedin.com/pulse/big-data-science-some-
reflections-compensation-levels-harry-powell)
=>
Citizen data scientist ei ole
korvattavissa, koska
toimialaosaaaminen ja tulosten
paikaansapitävyys vaatii
toistaiseksi ”ihmistulkit”
Agenda
• Tieto, tiede, motivaatio ja citizen
data science
• Kokonaisarkkitehtuuri ja
tiedolla johtaminen sekä
uudistettu JHS 179
• Kaksikätisyydellä selkeyttä
johtamiseen
• Näkemykset (insights) tulevat
• Miten citizen data scientist
pääsee konkreettisesti
eteenpäin?
Citizen data science muuttaa julkishallintoa
Kohti kansalaiskeskeistä palveluiden kehittämistä – miten
yhdistää tiedolla johtaminen ja kokonaisarkkitehtuurityö?”
Lähde: Ritvanen H., Sinipuro J., Hotti V.:http://ojs.tsv.fi/index.php/stty/article/view/45259
Uudistettu JHS 179 huomioi liiketoimintamallit ja
kyvykkyydet • ”Kyvykkyydet muodostuvat ihmisistä ja
osaamisesta, liiketoimintamalleista ja niitä
toteuttavista prosesseista sekä tiedoista ja
tietojärjestelmistä. Kyvykkyyksien ja niihin liittyvän
suorituskyvyn myötä syntyy toiminnan
kokonaiskyvykkyys toimia suunnitellulla
liiketoimintamallilla.”
• ”Useista erilaisista palveluista ja eri asiakasryhmistä
johtuen organisaatiolla voi olla
samanaikaisesti käytössään useita eri
liiketoimintamalleja ja niiden edellyttämiä
kyvykkyyksiä.”
• ”Kyky toimia tarkoituksenmukaisella tavalla tietyllä osa-
alueella, ja hyödyntää osaamistaan sekä resurssejaan, jotta
tavoitteet saavutetaan”
• ”Sekä yksityisten että julkisen hallinnon organisaatioiden
kyvykkyys koostuu kolmesta osakokonaisuudesta, joita ovat
toimintamallit ja prosessit, henkilöstö ja osaaminen sekä
tiedot ja järjestelmät”
JHS 179 ja kyvykkyyksien kuvaus
Tarvitaan jatkuvaa peilausta strategisiin tavoitteisiin –
toimiiko JHS 179 ”ketteränä” työkaluna?
• Kokonaisarkkitehtuurikuvaukset
ovat pääasiassa bottom-up-
kuvauksia kuten Six Sigmassa
• ”some of the organizations that
became poster boys for Six
Sigma have indeed secured
mouthwatering cost savings
from their effort, they have
simultaneously been very poor
performers on the stock market
and have been recognised for
their strategic failures”
Yhteentoimivuutta edesauttavat kansalliset palvelut
kuten KAPA (eli X-road) helpottavat tietovarantojen
hyödyntämistä
• Aika alkaa olla
otollinen erilaisten
tietopalvelujen
rakentamiseen eli
eri tietovarantojen
tietojen yhdistelyllä
saadaan aikaan
käyttökelpoisia
näkemyksiä
http://www.tivi.fi/Kaikki_uutiset/valtio-rakentaa-it-nyrkkia-vaestorekisterikeskukseen-6541723
Agenda
• Tieto, tiede, motivaatio ja citizen
data science
• Kokonaisarkkitehtuuri ja tiedolla
johtaminen sekä uudistettu JHS
179
• Kaksikätisyydellä selkeyttä
johtamiseen
• Näkemykset (insights) tulevat
• Miten citizen data scientist
pääsee konkreettisesti
eteenpäin?
Exploration ja exploitation ovat aktiviteettejä, jotka
voidaan liittää organisaation eri funktioihin
• March (1991) wrote as follows:
• Exploration “includes things captured by terms such as
search [etsiminen], variation [validointi], risk taking
[riskinottaminen], experimentation [kokeileminen],
play, flexibility [joustavuus], discovery, innovation”
• Exploitation “includes such things as refinement
[uudelleenmääritteleminen], choice, production,
efficiency [tehokkuus], selection, implementation,
execution”
• “Previous ambidexterity studies have shown that
exploration is linked to growth whereas
exploitation is linked to profits” (Bøe-
Lillegraven went, 2014)
• Bøe-Lillegraven (2014) went “beyond these
arguments, furthering our understanding of the
interaction mechanisms between six dimensions of
the explore/exploit value chains: resource
allocation, cost structure, value proposition,
market performance, revenues, and profits”
Lähde:
http://vserver1.cscs.lsa.umich.edu/~pjlamber/Complexity%20Cour
se_files/exploration_exploitation.pdf
Haetaan ”tasapainoa”
Exploitation
Improve
Mainly own data
BI (business
intelligence)
Slow learners
…
Exploration
Invent
Both open and
own data
AA (advanced
analytics)
AI (artificial
intelligence)
Fast learners
…
Lähde: https://archive.feedblitz.com/857009/~4530973
Agenda
• Tieto, tiede, motivaatio ja citizen
data science
• Kokonaisarkkitehtuuri ja tiedolla
johtaminen sekä uudistettu JHS
179
• Kaksikätisyydellä selkeyttä
johtamiseen
• Näkemykset (insights) tulevat
• Miten citizen data scientist pääsee
konkreettisesti eteenpäin?
IDOs are coming
Source: http://www.kdnuggets.com/2016/01/businesses-need-one-million-data-scientists-2018.html
Näkemyksiä palveluna
Esimerkiksi IBM Watsonin
Personal Insight, joka
tuottaa
aurinkopyrskäytyksiä
(sunbursts), jotka arvioivat
persoonallisuuden, tarpeet
ja arvot, joita voidaan
käyttää esimerkiksi
sidosryhmien
toimenpidesuunnittelussa
kuten milloin kannattaa
kontaktoida
Lähde: https://watson-pi-demo.mybluemix.net/sunburst
• Kokeillaan tekstin arviointia
https://watson-pi-
demo.mybluemix.net/?cm_mc_uid=40460998702314578514193
&cm_mc_sid_50200000=1458388845
• Teksti on seuraava (Hotti 29.2.2016: Question-based and pattern-
driven issues reflect the realization of the ability to compete):
When we will categorize contents the triggers are formed using
operators. The operators are used when the sentiments (i.e.,
positive, negative or neutral) are recognized, for example, from
tweets. Furthermore, it is possible to compare sentences to have an
algorithm scoring their similarity.
Nowadays, analytics tools support citizen data scientist, for example,
hiding the names of techniques (e,g., algorithms) and instead of
statistical issues the business-related concepts are used. For
example, data contain data items the role of which (e.g., input or
target) can vary. However, data modeling level or type (e.g., nominal,
ordinal and continuous/interval) affects for patterns and models.
For example, nominal data (e.g., names) can be counted, ordinal
data (e.g., ratings) can be counted and ordered, and continuous data
(e.g., amounts) can be counted, ordered and measured.
When we explore data then we try to find out patterns or models.
The exploring is used of instead of the analytics which refers “to
extracting useful business patterns or mathematical decision models
from preprocessed data set”. If there is no real target to steer the
analyzing process, then the main aim is to describe patterns (e.g.,
associations or clusters). If there is the real target, then the main aim
is to build models (e.g., networks, regressions and trees).
Valtiovarainministeriö
“The Ministry of Finance is led by the Minister of Finance. The
Government often also has another minister, whose field of
responsibility includes a part of the functions of the Ministry of
Finance. The division of the ministers' duties is agreed when the
Government is formed. The most senior civil servant in the
Ministry of Finance is the Permanent Secretary. The Permanent
Secretary is assisted by the Permanent Under-Secretary, the
Director of Administrative Governance and Development as well
as the Economic Policy Coordinator. There are approximately 380
people working in the Ministry.
The Ministry includes the Economics, Budget, Tax and Financial
Markets Departments as well as the Department for Local
Government and Regional Administration, the Public Sector ICT
operational unit and the Personnel and Governance Policy
Department, which also acts as the Office for the Government as
Employer. The Administrative Governance and Development is
responsible for internal administration of the Ministry; it also
provides communication services. The Secretariat for
International Affairs operates directly under the management. In
addition, the Government financial controller's function operates
within the Ministry.” http://vm.fi/en/management-and-
organisation
Source: Minelli Michael, Chambers Michele,
Dhiraj Ambiga, (2013), Big Data, Big Analytics:
Emerging Business Intelligence and Analytic
Trends for Today's Businesses, pp.13-14
Ei enää syitä, vaan näkemyksiä!?!
• Kirjassa Thinking, Fast and Slow nobelisti Kahnemann
toteaa ”we easily think associatively, metaphorically,
and causally. However, it is difficult to think
statistically”, niin tarvitaan tutkimusta, jossa tehdään
läpinäkyväksi organisaatioiden intuition ja faktoihin
perustuva päätöksenteko.
• Pelkät korrelaatiot eivät riitä, vaan tarvitaan asiayhteys
(context), joka antaa datalle merkityksen ja Data-ism-
kirjan kirjoittaja Steve Lohrin (2015, 109) mukaan
assosiaatiot ovat korrelaatioiden sijaan askel kohti
tietämystä (knowledge) eli kohti käytännöllisiä
oivalluksia.
• Syiden selvittäminen eli miksi-kysymykseen
vastaaminen kyseenalaistetaan Viktor Mayer-
Schönbergerin ja Kenneth Cukierin sanoin ”The ideal of
identifying causal mechanisms is a self-congratulatory
illusion; big data overturns this” (Lohr 2015, 112) –
tämän asian ymmärtäminen vaatinee jopa monitieteistä
tarkastelua, sillä Lohr viittaa asiayhteydessä myös
nobelisti Kahnemaniin ja siihen, että miksi-kysymykseen
vastaus tukee intuitiivista päätöksentekoa, eikä
hyödynnä dataa suorituksen johtamisessa organisaation
eri funktioissa.
Lähde: Steve LaValle, Eric Lesser, Rebecca Shockley, Michael S. Hopkins and
Nina Kruschwitz: Big Data, Analytics and the Path From Insights to Value. MIT
SLOAN MANAGEMENT REVIEW, 2011.
Agenda
• Tieto, tiede, motivaatio ja citizen
data science
• Kokonaisarkkitehtuuri ja tiedolla
johtaminen sekä uudistettu JHS
179
• Kaksikätisyydellä selkeyttä
johtamiseen
• Näkemykset (insights) tulevat
• Miten citizen data scientist
pääsee konkreettisesti
eteenpäin?
Business
models
Insights Exploitation Exploration Stakeholders
Datan hyödyntämisen perusfunktiot
Raportointi Ennustaminen ja
ennakointi sekä
ohjaaminen
Raportoinnin lisäksi tulevaisuutta ennustetaan
(forecasting) olemassa olevan datan perusteella tai
ennakoidaan (predict) datasta valikoitujen
ominaispiirteiden (attributes, characteristics, features,
items, variables) perusteella. Lisäksi halutaan ohjata
tulevaisuuden toimintaa.
Dataa hyödynnetään, jotta
organisaation periaatteet
konkretisoituvat ja osataan
valita tarvittava data
analysoitavaksi
Kuvan lähde: Gain ja Hotti (15.4.2016) Exploitation and exploration underpin business and insights underpin business analytics
Avainkysymysten avulla (key questions) voidaan
konkretisoida, mitä informaatiota halutaan saada selville
Kysymys Vastausaihio Vastaus-
tyyppi
Vastaus-
tiheys
Vertailu-
arvo
Data-
lähteet
Paljonko
tuotamme
taloudellista
tulosta?
Nettotulos = kokonaistulot -
kokonaiskulut (mukaan lukien
käyttökustannukset,
rahoituskulut ja verot)
raha kk ERP
Missä määrin
olemme pystyneet
pitämään
hankkimamme
asiakkaat?
Asiakkuuden pysyvyysaste =
(asiakkaiden määrä kauden
alussa / niiden asiakkaiden
määrä, jotka ovat asiakkaita
myös kauden lopussa) * 100
% kk CRM
Yksittäisen
työntekijän
suunnittele-
mattomien
poissaolojen
kerroin?
Absenteeism Bradford factor =
suunnittelemattomien
poissaolojen päivät *
(suunnittelemattomien
poissaolojen lkm)
numero kk 12 HRM
Kaksikätisyyttä ja liiketoimintamallin rakenneosia
sekä avainkysymyksiä voidaan ristiintaulukoida
• keskeiset kumppanit – Mitkä ovat motiivit
kumppanuuksille?
• keskeiset aktiviteetit – Mitä aktiviteettejä arvolupaus
vaatii?
• arvolupaukset (ml. tuotteet ja palvelut) - Mitä
asiakastarpeita (customer needs) tyydytetään ja millä?
• asiakassuhteet – Mitä suhteita asiakas meiltä odottaa?
• asiakassegmentit – Mille yhteyskuntaluokille (classes)
luomme arvoa?
• keskeiset resurssit – Mitä resursseja arvolupaus vaatii?
• kustannusrakenne – Kiinteät ja muuttuvat
kustannukset?
• kanavat – Mitä kanavia asiakkaat haluavat käyttää?
• tulovirrat - Mistä asiakkaat ovat valmiita maksamaan?
Analytiikka
Exploitation
Exploration
Kumppanit
Aktiviteetit
Arvolupaukset
Asiakassuhteet
Asiakassegmentit
Resurssit
Kustannukset
Kanavat
Tulovirrat
Kassavirta x x x
Kysynnän ennakointi
(predictive sales)
x x x x
Kapasiteetin käyttö
(capacity utilization)
x x x x x x x x x x
Tyydyttämättömät
tarpeet (unmet needs)
x x x x
Organisaation kulttuuri x x x x x x x x
Sosiaalinen tai
yhteiskunnallinen
vastuu
x x x x x x x x
Kokonaisarkkitehtuurikuvauksia voidaan
hyödyntää mittarimäärittelyssä
• Kokoa periaatetason kuvaukset
• Kokoa näkökulmia yhdistävät matriisit
• Jollei liiketoimintamallia ole, niin hahmottele
liiketoimintamalli periaatetason kuvaukset
huomioiden
• Mieti yksi tavoite, jota haluat seurata
• Mieti, miten tavoitteen seurantamittarille
lasketaan arvo
• Mieti, mitä dataa tarvitset seurantamittarin arvon
laskemiseksi
• Tunnista datalähteet, joissa on tarvittava data
sijaitsee
• Tavalla tai toiselle hanki tarvittavat datajoukot
• Yhdistä datajoukot muistinvaraisesti ja määrittele
valitulla työkalulla seurantamittari
Esimerkiksi excelin lisäominaisuuksilla voi
harjoitella datan manipulointia ja analysointia
• Valitaan 1 tai useampi datajoukko
• Kuvaillaan datajoukot
• Yhdistetään datajoukot muistinvaraisesti
(lisäominaisuudet Power Query + Power Pivot)
• Visualisoidaan yhdistelyn tuloksia eri tavoin kuten
pivot-taulut
• Jos datajoukoissa on aikaleimoja, niin ennustetaan
(forecasting) jonkun muuttujan arvoja
tulevaisuudessa
• Jos käytössä on tieto sekä käytettävistä resursseista
että suoritevaatimukset, niin muodostetaan
optimointimalleja (lisäominaisuus Ratkaisin)
• Jos käytössä on esimerkiksi data mining -
lisäominaisuuksia, niin muodostetaan mallinteita
ja/tai malleja
• Muistinvaraisen tietomallin voi siirtää Power BI –
työkaluun ja jatkaa visualisoinnin harjoittelua eri
tavoin kuten gauget ja treemapit
Business
models
Insights Exploitation Exploration Stakeholders
Näkemyksellinen citizen data science muuttaa julkishallintoa eli
citizen datatieteilijät osaavat navigoida analytiikka- ja
indikaattorizoossa sekä muodostavat tai muodostuttavat
liiketoimintamalleja tukevia käyttökelpoisia näkemyksiä
Canvakset esiintyvät nykyisin
liiketoimintamalleissa ja
työkaluissa. Rakenneosat
(building blocks)
liiketoimintamalleissa ja
kognitiivisten sovellusten
rakenneosina – “the cognitive
computing features allow us
to form innovative business
models and they reduce the
number of needed analytics”
(Gain ja Hotti (15.4.2016)
Exploitation and exploration
underpin business and
insights underpin business
analytics)
Loppumotto:
Loista lainavaloilla kunnes omat valot syttyvät
Virpi Hotti
https://fi.linkedin.com/in/virpihotti
Esityksen kuulijoita kiittäen
When we will categorize contents the triggers are formed using operators.The
operatorsareused when the sentiments (i.e., positive, negative or neutral) are
recognized, for example,from tweets. Furthermore,it is possibleto compare
sentences to have an algorithm scoring their similarity.
Nowadays,analytics tools supportcitizen data scientist, for example,hiding the
names of techniques (e,g., algorithms) and instead of statistical issues the business-
related concepts are used. For example,data contain data items the role of which
(e.g., inputor target) can vary. However, data modelinglevel or type (e.g., nominal,
ordinaland continuous/interval) affects for patterns and models. For example,
nominaldata (e.g., names)can be counted,ordinaldata (e.g., ratings) can be
counted and ordered, andcontinuous data (e.g., amounts)can be counted,ordered
and measured.
When we exploredata then we try to find out patterns or models. Theexploringis
used of instead of the analytics which refers “to extracting usefulbusiness patterns
or mathematicaldecision models frompreprocesseddata set”. If there is no real
target to steer the analyzing process,then the main aim is to describepatterns(e.g.,
associations orclusters).If there is the real target, then the main aim is to build
models (e.g., networks,regressions and trees)

More Related Content

Citizen data science muuttaa julkishallintoa

  • 1. Alkumotto: Mieli kielen sanoittaa, kokemus kielenkannan kirvoittaa Virpi Hotti https://fi.linkedin.com/in/virpihotti Citizen data science muuttaa julkishallintoa
  • 2. Agenda • Tieto, tiede, motivaatio ja citizen data science • Kokonaisarkkitehtuuri ja tiedolla johtaminen sekä uudistettu JHS 179 • Kaksikätisyydellä selkeyttä johtamiseen • Näkemykset (insights) tulevat • Miten citizen data scientist pääsee konkreettisesti eteenpäin? ”Näkemyksellinen citizen data science muuttaa julkishallintoa eli citizen datatieteilijät osaavat navigoida analytiikka- ja indikaattorizoossa sekä muodostavat tai muodostuttavat liiketoimintamalleja tukevia käyttökelpoisia näkemyksiä”
  • 3. Agenda • Tieto, tiede, motivaatio ja citizen data science • Kokonaisarkkitehtuuri ja tiedolla johtaminen sekä uudistettu JHS 179 • Kaksikätisyydellä selkeyttä johtamiseen • Näkemykset (insights) tulevat • Miten citizen data scientist pääsee konkreettisesti eteenpäin? Google-kuvahaku: JasonGoto
  • 4. Tieto • ”Suomen kielessä tiedolla voidaan tarkoittaa dataa, informaatiota tai oppimisen ja kokemuksen kautta muodostuvaa tietämystä” (JHS 179) • “Knowledge is the theoretical paradigm, the what to do and the why. Skill is the how to do. And desire is the motivation, the want to do. In order to make something a habit in our lives, we have to have all three.” (The 7 Habits of Highly Effective People: Powerful Lessons in Personal Change) Kuvan lähde: https://www.pursuant.com/blog/redefining-fundraising-data/ Google-kuvahaku: JasonGoto.
  • 5. Tiede • “Science in its original sense is a word for a type of knowledge . . . In particular it is one of the types of knowledge which people can communicate to each other and share” (https://en.wikipedia.org/wiki/Science) • Ilkka Niiniluodon mukaan filosofiassa eli viisaustieteeteessä on jotain pysyvää eli ”Ainakin hyvät argumentit ja hyvät käsitteet, ja kyllä se tietokin pikkuhiljaa karttuu” (HS, 12.3.2016) Google-kuvahaku: JasonGoto.
  • 6. Motivaatio • 16 perusmotiivia Steven Reissin mukaan: valta, riippumattomuus, uteliaisuus, hyväksyntä, järjestys, säästäminen/kerääminen, kunnia, idealismi, sosiaaliset kontaktit, perhe, status, kosto/voittaminen, esteettisyys, syöminen, ruumiillinen aktiivisuus, rauhallisuus/mielenrauha • Suomessa 11 % on sitoutuneita työhönsä, 13 % pistää kapuloita rattaisiin ja sabotoi tavoitteisiin pääsyä (MMA 2/2016) Lähde: http://thumbs.dreamstime.com/z/maslow-pyramid-theory-needs-21205277.jpg
  • 7. Kuvan lähde: https://www.gartner.com/newsroom/id/3114217 Hype Cycle Report of Emerging technologies (Gartner 2015) – Big Data putosi ja tilalle siihen liittyviä “teknologioi ta” kuten Citizen Data Science
  • 8. Gartnerin määritelmät datatieteilijöille • Citizen data scientists are “people on the business side that may have some data skills, possibly from a math or even social science degree—and putting them to work exploring and analyzing data” • “The data scientist role is critical for organizations looking to extract insight from information assets for “big data” initiatives and requires a broad combination of skills that may be fulfilled better as a team, for example: Collaboration and team work is required for working with business stakeholders to understand business issues. Analytical and decision modeling skills are required for discovering relationships within data and detecting patterns. Data management skills are required to build the relevant dataset used for the analysis.” Lähteet: http://www.kdnuggets.com/2015/08/gartner-2015-hype-cycle-big-data-is-out-machine-learning-is-in.html ja https://www.gartner.com/it-glossary/data-scientist/
  • 9. Datan auki avaaminen (eli analytiikka) on ensisijaisesti yhteenvetojen tekemistä datajoukon ominaisuuksista Kuvan lähde: Hotti V., Gain U., Lintula H., Puumalainen A., Salomaa H.: Construction of business-driven capta processing. The 3rd Virtual International Conference on Advanced Research in Scientific Areas (ARSA-2014) Slovakia, December 1 - 5, 2014. “Data exploration is the first step in data analysis and typically involves summarizing the main characteristics of a dataset.” http://searchbusinessanalytics.techtarget .com/definition/data-exploration
  • 10. Ja Pareton periaate pätee täälläkin… Lähde: http://community.lithium.com/t5/Science-of-Social-blog/Big-Data-Reduction-1-Descriptive-Analytics/ba-p/77766
  • 11. Citizen data scientist on digitaalinen isännöitsijä? Lähde 25.3.2016: http://www.tivi.fi/Kaikki_uutiset/ai-mukamas- kuuma-it-duuni-edelleen-pelkka-digitaalinen-talonmies-6535738 Lähde: Advanced Business Analytics Course Notes, SAS Institute.
  • 12. Citizen data science kulmakivet • Yksilön/yhteisön ymmärryksen lisääntyessä kognitiosta siirrytään toimintaan. Se tarkoittaa mm. (liike)toiminnan kannalta merkityksellisien, dataan perustuvien ratkaisuehdotuksien tekemistä ja niiden toteuttamista • Analytiikka kuuluu kaikille ja sen tulee olla helposti lähestyttävää (approachable) • Data-analytiikan avulla tuotetaan eri toimialoilla toimiville organisaatioille käyttökelpoisia/käytännönläheisiä näkemyksiä (actionable insights) • Monimuotoisia datajoukkoja kuvaillaan ja yhdistetään sekä visualisoidaan sekä hyödynnetään ohjaamatonta (unsupervised) tai ohjattua (supervised) koneoppimista (machine learning), johon liittyy myös syväoppiminen (deep learning) • Koko ajan on mietittävä, mitä arvoa datalla on ja kenelle sekä millä viiveellä (millisekunneista vuosiin) Data Data models, advanced analytics and BI tools, etc. Business Business models, key questions, indicators, etc People Decision models, experiences, etc.
  • 13. Liiketoiminta- ja/tai toimialaosaamista tarvitaan tulosten tulkinnassa (paikkaansapitävyys ja oikeellisuus) Lähde: https://en.wikipedia.org/wiki/Accuracy_and_precisionLähde: http://www.mathsisfun.com/accuracy-precision.html
  • 14. Abreu “Grindaa ja flowaa” ja datatieteteilijät “Blendaa ja advaa” . . . Source: http://pages.alteryx.com/rs/alteryx/images/Data%20Blending%20For%20Dummies%20by%20Wiley%20- %20from%20Alteryx.pdf “can data scientists be replaced by a general data science machine? A number of vendors are betting big that it can. Managers across the world are hoping they are right.” (https://www.linkedin.com/pulse/big-data-science-some- reflections-compensation-levels-harry-powell) => Citizen data scientist ei ole korvattavissa, koska toimialaosaaaminen ja tulosten paikaansapitävyys vaatii toistaiseksi ”ihmistulkit”
  • 15. Agenda • Tieto, tiede, motivaatio ja citizen data science • Kokonaisarkkitehtuuri ja tiedolla johtaminen sekä uudistettu JHS 179 • Kaksikätisyydellä selkeyttä johtamiseen • Näkemykset (insights) tulevat • Miten citizen data scientist pääsee konkreettisesti eteenpäin?
  • 17. Kohti kansalaiskeskeistä palveluiden kehittämistä – miten yhdistää tiedolla johtaminen ja kokonaisarkkitehtuurityö?” Lähde: Ritvanen H., Sinipuro J., Hotti V.:http://ojs.tsv.fi/index.php/stty/article/view/45259
  • 18. Uudistettu JHS 179 huomioi liiketoimintamallit ja kyvykkyydet • ”Kyvykkyydet muodostuvat ihmisistä ja osaamisesta, liiketoimintamalleista ja niitä toteuttavista prosesseista sekä tiedoista ja tietojärjestelmistä. Kyvykkyyksien ja niihin liittyvän suorituskyvyn myötä syntyy toiminnan kokonaiskyvykkyys toimia suunnitellulla liiketoimintamallilla.” • ”Useista erilaisista palveluista ja eri asiakasryhmistä johtuen organisaatiolla voi olla samanaikaisesti käytössään useita eri liiketoimintamalleja ja niiden edellyttämiä kyvykkyyksiä.” • ”Kyky toimia tarkoituksenmukaisella tavalla tietyllä osa- alueella, ja hyödyntää osaamistaan sekä resurssejaan, jotta tavoitteet saavutetaan” • ”Sekä yksityisten että julkisen hallinnon organisaatioiden kyvykkyys koostuu kolmesta osakokonaisuudesta, joita ovat toimintamallit ja prosessit, henkilöstö ja osaaminen sekä tiedot ja järjestelmät”
  • 19. JHS 179 ja kyvykkyyksien kuvaus
  • 20. Tarvitaan jatkuvaa peilausta strategisiin tavoitteisiin – toimiiko JHS 179 ”ketteränä” työkaluna? • Kokonaisarkkitehtuurikuvaukset ovat pääasiassa bottom-up- kuvauksia kuten Six Sigmassa • ”some of the organizations that became poster boys for Six Sigma have indeed secured mouthwatering cost savings from their effort, they have simultaneously been very poor performers on the stock market and have been recognised for their strategic failures”
  • 21. Yhteentoimivuutta edesauttavat kansalliset palvelut kuten KAPA (eli X-road) helpottavat tietovarantojen hyödyntämistä • Aika alkaa olla otollinen erilaisten tietopalvelujen rakentamiseen eli eri tietovarantojen tietojen yhdistelyllä saadaan aikaan käyttökelpoisia näkemyksiä http://www.tivi.fi/Kaikki_uutiset/valtio-rakentaa-it-nyrkkia-vaestorekisterikeskukseen-6541723
  • 22. Agenda • Tieto, tiede, motivaatio ja citizen data science • Kokonaisarkkitehtuuri ja tiedolla johtaminen sekä uudistettu JHS 179 • Kaksikätisyydellä selkeyttä johtamiseen • Näkemykset (insights) tulevat • Miten citizen data scientist pääsee konkreettisesti eteenpäin?
  • 23. Exploration ja exploitation ovat aktiviteettejä, jotka voidaan liittää organisaation eri funktioihin • March (1991) wrote as follows: • Exploration “includes things captured by terms such as search [etsiminen], variation [validointi], risk taking [riskinottaminen], experimentation [kokeileminen], play, flexibility [joustavuus], discovery, innovation” • Exploitation “includes such things as refinement [uudelleenmääritteleminen], choice, production, efficiency [tehokkuus], selection, implementation, execution” • “Previous ambidexterity studies have shown that exploration is linked to growth whereas exploitation is linked to profits” (Bøe- Lillegraven went, 2014) • Bøe-Lillegraven (2014) went “beyond these arguments, furthering our understanding of the interaction mechanisms between six dimensions of the explore/exploit value chains: resource allocation, cost structure, value proposition, market performance, revenues, and profits” Lähde: http://vserver1.cscs.lsa.umich.edu/~pjlamber/Complexity%20Cour se_files/exploration_exploitation.pdf
  • 24. Haetaan ”tasapainoa” Exploitation Improve Mainly own data BI (business intelligence) Slow learners … Exploration Invent Both open and own data AA (advanced analytics) AI (artificial intelligence) Fast learners … Lähde: https://archive.feedblitz.com/857009/~4530973
  • 25. Agenda • Tieto, tiede, motivaatio ja citizen data science • Kokonaisarkkitehtuuri ja tiedolla johtaminen sekä uudistettu JHS 179 • Kaksikätisyydellä selkeyttä johtamiseen • Näkemykset (insights) tulevat • Miten citizen data scientist pääsee konkreettisesti eteenpäin?
  • 26. IDOs are coming Source: http://www.kdnuggets.com/2016/01/businesses-need-one-million-data-scientists-2018.html
  • 27. Näkemyksiä palveluna Esimerkiksi IBM Watsonin Personal Insight, joka tuottaa aurinkopyrskäytyksiä (sunbursts), jotka arvioivat persoonallisuuden, tarpeet ja arvot, joita voidaan käyttää esimerkiksi sidosryhmien toimenpidesuunnittelussa kuten milloin kannattaa kontaktoida Lähde: https://watson-pi-demo.mybluemix.net/sunburst
  • 28. • Kokeillaan tekstin arviointia https://watson-pi- demo.mybluemix.net/?cm_mc_uid=40460998702314578514193 &cm_mc_sid_50200000=1458388845 • Teksti on seuraava (Hotti 29.2.2016: Question-based and pattern- driven issues reflect the realization of the ability to compete): When we will categorize contents the triggers are formed using operators. The operators are used when the sentiments (i.e., positive, negative or neutral) are recognized, for example, from tweets. Furthermore, it is possible to compare sentences to have an algorithm scoring their similarity. Nowadays, analytics tools support citizen data scientist, for example, hiding the names of techniques (e,g., algorithms) and instead of statistical issues the business-related concepts are used. For example, data contain data items the role of which (e.g., input or target) can vary. However, data modeling level or type (e.g., nominal, ordinal and continuous/interval) affects for patterns and models. For example, nominal data (e.g., names) can be counted, ordinal data (e.g., ratings) can be counted and ordered, and continuous data (e.g., amounts) can be counted, ordered and measured. When we explore data then we try to find out patterns or models. The exploring is used of instead of the analytics which refers “to extracting useful business patterns or mathematical decision models from preprocessed data set”. If there is no real target to steer the analyzing process, then the main aim is to describe patterns (e.g., associations or clusters). If there is the real target, then the main aim is to build models (e.g., networks, regressions and trees).
  • 29. Valtiovarainministeriö “The Ministry of Finance is led by the Minister of Finance. The Government often also has another minister, whose field of responsibility includes a part of the functions of the Ministry of Finance. The division of the ministers' duties is agreed when the Government is formed. The most senior civil servant in the Ministry of Finance is the Permanent Secretary. The Permanent Secretary is assisted by the Permanent Under-Secretary, the Director of Administrative Governance and Development as well as the Economic Policy Coordinator. There are approximately 380 people working in the Ministry. The Ministry includes the Economics, Budget, Tax and Financial Markets Departments as well as the Department for Local Government and Regional Administration, the Public Sector ICT operational unit and the Personnel and Governance Policy Department, which also acts as the Office for the Government as Employer. The Administrative Governance and Development is responsible for internal administration of the Ministry; it also provides communication services. The Secretariat for International Affairs operates directly under the management. In addition, the Government financial controller's function operates within the Ministry.” http://vm.fi/en/management-and- organisation
  • 30. Source: Minelli Michael, Chambers Michele, Dhiraj Ambiga, (2013), Big Data, Big Analytics: Emerging Business Intelligence and Analytic Trends for Today's Businesses, pp.13-14
  • 31. Ei enää syitä, vaan näkemyksiä!?! • Kirjassa Thinking, Fast and Slow nobelisti Kahnemann toteaa ”we easily think associatively, metaphorically, and causally. However, it is difficult to think statistically”, niin tarvitaan tutkimusta, jossa tehdään läpinäkyväksi organisaatioiden intuition ja faktoihin perustuva päätöksenteko. • Pelkät korrelaatiot eivät riitä, vaan tarvitaan asiayhteys (context), joka antaa datalle merkityksen ja Data-ism- kirjan kirjoittaja Steve Lohrin (2015, 109) mukaan assosiaatiot ovat korrelaatioiden sijaan askel kohti tietämystä (knowledge) eli kohti käytännöllisiä oivalluksia. • Syiden selvittäminen eli miksi-kysymykseen vastaaminen kyseenalaistetaan Viktor Mayer- Schönbergerin ja Kenneth Cukierin sanoin ”The ideal of identifying causal mechanisms is a self-congratulatory illusion; big data overturns this” (Lohr 2015, 112) – tämän asian ymmärtäminen vaatinee jopa monitieteistä tarkastelua, sillä Lohr viittaa asiayhteydessä myös nobelisti Kahnemaniin ja siihen, että miksi-kysymykseen vastaus tukee intuitiivista päätöksentekoa, eikä hyödynnä dataa suorituksen johtamisessa organisaation eri funktioissa. Lähde: Steve LaValle, Eric Lesser, Rebecca Shockley, Michael S. Hopkins and Nina Kruschwitz: Big Data, Analytics and the Path From Insights to Value. MIT SLOAN MANAGEMENT REVIEW, 2011.
  • 32. Agenda • Tieto, tiede, motivaatio ja citizen data science • Kokonaisarkkitehtuuri ja tiedolla johtaminen sekä uudistettu JHS 179 • Kaksikätisyydellä selkeyttä johtamiseen • Näkemykset (insights) tulevat • Miten citizen data scientist pääsee konkreettisesti eteenpäin? Business models Insights Exploitation Exploration Stakeholders
  • 33. Datan hyödyntämisen perusfunktiot Raportointi Ennustaminen ja ennakointi sekä ohjaaminen Raportoinnin lisäksi tulevaisuutta ennustetaan (forecasting) olemassa olevan datan perusteella tai ennakoidaan (predict) datasta valikoitujen ominaispiirteiden (attributes, characteristics, features, items, variables) perusteella. Lisäksi halutaan ohjata tulevaisuuden toimintaa.
  • 34. Dataa hyödynnetään, jotta organisaation periaatteet konkretisoituvat ja osataan valita tarvittava data analysoitavaksi Kuvan lähde: Gain ja Hotti (15.4.2016) Exploitation and exploration underpin business and insights underpin business analytics
  • 35. Avainkysymysten avulla (key questions) voidaan konkretisoida, mitä informaatiota halutaan saada selville Kysymys Vastausaihio Vastaus- tyyppi Vastaus- tiheys Vertailu- arvo Data- lähteet Paljonko tuotamme taloudellista tulosta? Nettotulos = kokonaistulot - kokonaiskulut (mukaan lukien käyttökustannukset, rahoituskulut ja verot) raha kk ERP Missä määrin olemme pystyneet pitämään hankkimamme asiakkaat? Asiakkuuden pysyvyysaste = (asiakkaiden määrä kauden alussa / niiden asiakkaiden määrä, jotka ovat asiakkaita myös kauden lopussa) * 100 % kk CRM Yksittäisen työntekijän suunnittele- mattomien poissaolojen kerroin? Absenteeism Bradford factor = suunnittelemattomien poissaolojen päivät * (suunnittelemattomien poissaolojen lkm) numero kk 12 HRM
  • 36. Kaksikätisyyttä ja liiketoimintamallin rakenneosia sekä avainkysymyksiä voidaan ristiintaulukoida • keskeiset kumppanit – Mitkä ovat motiivit kumppanuuksille? • keskeiset aktiviteetit – Mitä aktiviteettejä arvolupaus vaatii? • arvolupaukset (ml. tuotteet ja palvelut) - Mitä asiakastarpeita (customer needs) tyydytetään ja millä? • asiakassuhteet – Mitä suhteita asiakas meiltä odottaa? • asiakassegmentit – Mille yhteyskuntaluokille (classes) luomme arvoa? • keskeiset resurssit – Mitä resursseja arvolupaus vaatii? • kustannusrakenne – Kiinteät ja muuttuvat kustannukset? • kanavat – Mitä kanavia asiakkaat haluavat käyttää? • tulovirrat - Mistä asiakkaat ovat valmiita maksamaan? Analytiikka Exploitation Exploration Kumppanit Aktiviteetit Arvolupaukset Asiakassuhteet Asiakassegmentit Resurssit Kustannukset Kanavat Tulovirrat Kassavirta x x x Kysynnän ennakointi (predictive sales) x x x x Kapasiteetin käyttö (capacity utilization) x x x x x x x x x x Tyydyttämättömät tarpeet (unmet needs) x x x x Organisaation kulttuuri x x x x x x x x Sosiaalinen tai yhteiskunnallinen vastuu x x x x x x x x
  • 37. Kokonaisarkkitehtuurikuvauksia voidaan hyödyntää mittarimäärittelyssä • Kokoa periaatetason kuvaukset • Kokoa näkökulmia yhdistävät matriisit • Jollei liiketoimintamallia ole, niin hahmottele liiketoimintamalli periaatetason kuvaukset huomioiden • Mieti yksi tavoite, jota haluat seurata • Mieti, miten tavoitteen seurantamittarille lasketaan arvo • Mieti, mitä dataa tarvitset seurantamittarin arvon laskemiseksi • Tunnista datalähteet, joissa on tarvittava data sijaitsee • Tavalla tai toiselle hanki tarvittavat datajoukot • Yhdistä datajoukot muistinvaraisesti ja määrittele valitulla työkalulla seurantamittari
  • 38. Esimerkiksi excelin lisäominaisuuksilla voi harjoitella datan manipulointia ja analysointia • Valitaan 1 tai useampi datajoukko • Kuvaillaan datajoukot • Yhdistetään datajoukot muistinvaraisesti (lisäominaisuudet Power Query + Power Pivot) • Visualisoidaan yhdistelyn tuloksia eri tavoin kuten pivot-taulut • Jos datajoukoissa on aikaleimoja, niin ennustetaan (forecasting) jonkun muuttujan arvoja tulevaisuudessa • Jos käytössä on tieto sekä käytettävistä resursseista että suoritevaatimukset, niin muodostetaan optimointimalleja (lisäominaisuus Ratkaisin) • Jos käytössä on esimerkiksi data mining - lisäominaisuuksia, niin muodostetaan mallinteita ja/tai malleja • Muistinvaraisen tietomallin voi siirtää Power BI – työkaluun ja jatkaa visualisoinnin harjoittelua eri tavoin kuten gauget ja treemapit
  • 39. Business models Insights Exploitation Exploration Stakeholders Näkemyksellinen citizen data science muuttaa julkishallintoa eli citizen datatieteilijät osaavat navigoida analytiikka- ja indikaattorizoossa sekä muodostavat tai muodostuttavat liiketoimintamalleja tukevia käyttökelpoisia näkemyksiä Canvakset esiintyvät nykyisin liiketoimintamalleissa ja työkaluissa. Rakenneosat (building blocks) liiketoimintamalleissa ja kognitiivisten sovellusten rakenneosina – “the cognitive computing features allow us to form innovative business models and they reduce the number of needed analytics” (Gain ja Hotti (15.4.2016) Exploitation and exploration underpin business and insights underpin business analytics)
  • 40. Loppumotto: Loista lainavaloilla kunnes omat valot syttyvät Virpi Hotti https://fi.linkedin.com/in/virpihotti Esityksen kuulijoita kiittäen When we will categorize contents the triggers are formed using operators.The operatorsareused when the sentiments (i.e., positive, negative or neutral) are recognized, for example,from tweets. Furthermore,it is possibleto compare sentences to have an algorithm scoring their similarity. Nowadays,analytics tools supportcitizen data scientist, for example,hiding the names of techniques (e,g., algorithms) and instead of statistical issues the business- related concepts are used. For example,data contain data items the role of which (e.g., inputor target) can vary. However, data modelinglevel or type (e.g., nominal, ordinaland continuous/interval) affects for patterns and models. For example, nominaldata (e.g., names)can be counted,ordinaldata (e.g., ratings) can be counted and ordered, andcontinuous data (e.g., amounts)can be counted,ordered and measured. When we exploredata then we try to find out patterns or models. Theexploringis used of instead of the analytics which refers “to extracting usefulbusiness patterns or mathematicaldecision models frompreprocesseddata set”. If there is no real target to steer the analyzing process,then the main aim is to describepatterns(e.g., associations orclusters).If there is the real target, then the main aim is to build models (e.g., networks,regressions and trees)