Skip to main content

Tekoälyluvat

Sivustosi kertoo tekoälyille ja hakukoneille, mihin ne saavat sen sisältöä käyttää. Asetus välittyy robots.txt-tiedoston Content-Signal-rivillä — kyseessä on AI Preferences -työryhmän standardiehdotus, jota suuret toimijat (OpenAI, Anthropic, Google, Common Crawl) ovat ilmoittaneet noudattavansa.

Asetukset ovat sivustokohtaisia ja löytyvät site-config.json-tiedoston ai_signals-lohkosta. Helpoin tapa muuttaa niitä on pyytää Kamua: "Estä sisältöni käyttö tekoälyn koulutuksessa."

Kolme lupaa

  • search — saako sisältö näkyä hakutuloksissa (perinteiset hakukoneet ja tekoälypohjaiset hakukoneet kuten Perplexity).
  • ai_input — saako tekoälyavustaja (esim. ChatGPT, Claude) hakea sivultasi tietoa kun käyttäjä kysyy siltä jotain. Tätä kautta asiakkaat löytävät sinut tekoälyavustajien avulla tänä päivänä.
  • ai_train — saako sisältösi päätyä tekoälymallien koulutusdataan eli osaksi seuraavan sukupolven mallien "muistia". Eri asia kuin ai_input — koulutus tapahtuu kerran etukäteen, käyttö tapahtuu joka kerta kun joku kysyy.

Jokainen arvo on joko yes tai no. Oletuksena kaikki ovat yes, koska markkinointisivuston ydintehtävä on tulla löydetyksi.

Milloin valita no?

Useimmilla yrityksillä ei ole syytä rajoittaa mitään näistä, mutta on tilanteita joissa rajaus on perusteltu:

  • ai_train: no — jos sisältösi on ainutlaatuista asiantuntijatekstiä, jonka et halua päätyvän osaksi yleisiä tekoälymalleja. Käyttäjä voi silti löytää sinut tekoälyavustajalla, mutta sisältösi ei tallennu mallin painoihin.
  • ai_input: no — jos et halua, että tekoälyavustajat hakevat sivultasi tietoa lainkaan. Tämä on vahva rajoitus ja heikentää näkyvyyttäsi tekoälyhauissa.
  • search: no — käytännössä piilottaa sivustosi hakukoneilta. Hyvin harvinainen valinta julkiselle markkinointisivustolle.

Asetusten muuttaminen

Pyydä Kamua muokkaamaan asetukset puolestasi:

  • "Salli kaikki: hakukoneet, tekoälykäyttö ja koulutus." (oletustila)
  • "Estä koulutuskäyttö mutta salli muu käyttö."
  • "Estä tekoälyhaut kokonaan."

Muutos näkyy seuraavan julkaisun jälkeen sivustosi robots.txt-tiedostossa esimerkiksi näin:

User-agent: *
Content-Signal: search=yes, ai-input=yes, ai-train=no
Allow: /

Sitemap: /sitemap-index.xml

Huomioita

  • Content-Signal on ilmoitusmekanismi, ei tekninen este. Se nojaa siihen, että tekoälytoimijat lukevat ja kunnioittavat tiedostoa — aivan kuten perinteinen robots.txt on aina toiminut.
  • Asetukset koskevat vain tulevaisuutta. Jos sisältösi on jo päätynyt jonkin mallin koulutusdataan, ai_train: no ei poista sitä sieltä.
  • Voit tarkistaa sivustosi nykyisen tilan osoitteessa isitagentready.com syöttämällä sivuston osoitteen.