Snippets

Ein Snippet ist ein kleiner Denkanstoss aus meinem Alltag.

17.04.26

Chrome Extension mit Claude Code

Last month, I built a Chrome extension that pulls lead data from a LinkedIn profile and sends it straight to HubSpot. 240 leads enriched. 8 meetings booked. Total cost: $18. Here's exactly how I did it with Claude Code:

Step 1: Record what you want - I opened the Apple Voice Memos app on my phone and recorded a voice message. I spoke as if I were explaining it to another person. I described exactly what I wanted: I visit a LinkedIn profile, Extension opens in the sidebar, Click a button to extract the name, title, and company details, Send it straight to HubSpot. The more specific you are here, the better the output.

Step 2: Set up Claude Code - I opened my terminal, created a blank folder, and started Claude Code inside of it. I said: "This is a blank, empty folder. I want to work on a new project." Then I pasted the full voice memo and switched to planning mode. Claude Code has a Supabase plugin that helps generate a full project plan. I reviewed every step of the plan before moving forward.

Step 3: Build the first version - Once the plan looked right, I told it to build the first version. It worked for about five to ten minutes. Then it told me how to install the extension.

Step 4: Test and iterate - From there I tested it, found bugs, added features, removed things I didn't like, gave feedback. I also have Git running in the background tracking every version. So when Claude makes an error, I can always roll back to what I had before. Eight months ago, this process used to take a lot of back and forth. Now it's straightforward.

The results: Manually entering those leads at 3 minutes each would have taken me 12 hours. With the extension, about 30 minutes. It also replaced two subscriptions that would have run me $80 a month. You don't need to be a developer to build your own tools anymore. You just need to be specific about what you want.

17.04.26

Der unsichtbare Wissensträger

A few weeks ago, I had a call with a sales director. He said: "Our entire market intelligence is basically one person. He retires in two years. That's why we're looking for a solution." You could hear the panic.

I didn't show a demo. I just asked him to walk me through what that person actually does. It's always the same profile. Someone who's been in the industry for 20+ years, knows everyone, and has relationships across competitors, suppliers, and former colleagues. They go to trade fairs and don't "network". They just walk around and talk to people they've known for decades. They sit down for a coffee and ask: "How's business going at your end?" And somehow, they know everything that matters.

Inside the company, they're the default answer. Any question about the market: "Go to him." But the problem is that none of this is written down. It's not in a system, database, or even structured anywhere. It's in one person's head, and I've now seen this at multiple companies.

What happens next is predictable. The senior person leaves. They hire someone junior who is smart, capable, and motivated, but starting at zero. They have no network, context, and intuition for what signals actually matter.

I've now had this exact conversation with multiple companies. They all have the same question at the end: "What do we do when this person is gone?" No one has a real answer yet.

15.04.26

Sichtbarkeit beginnt ausserhalb der eigenen Mauern

At 20, I worked at a Swiss watch manufacturer. The owner had designed a new buckle and sent the plans to a factory in China to build a prototype. Before the prototype even came back, one of the employees was walking through a black market in China. He found the buckle fully assembled, already being sold.

That was the first time I understood how little visibility you actually have. You can own the patents and control the process. But it doesn't matter. If you're not actively watching what's happening outside your walls, you're blind.

Two observations from this job: 1. Information moves faster than you think. 2. The signals that matter are rarely visible in the places people usually look.

I kept seeing the same pattern in every role after that. The questions were always the same: What are competitors doing? Where is the market moving? How do we respond? The problem was never the question, but the lack of visibility.

That's why I started building Gopf – Strategic Intelligence to actually make sense of the signals that are already there.

13.04.26

Zwei Schuhverkäufer

In the 1900's, two British salesmen land overseas to sell shoes. The first telegraphs Manchester: It's a disaster, nobody here wears shoes. The second writes: This is the biggest opportunity of my career.

I heard this story on a TED talk from Benjamin Zander last month and couldn't stop thinking about it. I had the exact same moment six months ago when I realized almost no one in Swiss manufacturing has strategic intelligence. Most people hear that and think: must not be needed. I hear it and think: this market is wide open for opportunity.

For decades, Swiss manufacturers didn't need to compete. Then tariffs closed the US. Conflicts disrupted the East. Swiss currency got so strong that exports barely make sense.

Last week, three different companies called me asking the same questions: What does the Brazilian market look like? Where else could we go? Where could we gain market share?

Those questions are buzzing in every boardroom right now. And almost none of them have the infrastructure to answer it. The gap is massive. And I'm the second salesman in this story.

13.04.26

Das ICP-Dokument, das nie fertig wird

I've been rewriting the same Ideal Customer Profile document for 2 years. It's now 22 slides, a custom tool, and a full sales dashboard. And it's still not finished.

Most founders define their ICP once: Company size, industry, and job title. Done. But we went deeper. The job isn't just functional. It's emotional: "I don't want to look wrong in front of the board." "I don't want to defend my work every time."

That's where buying decisions actually happen. So we stopped talking about features and built everything around the job.

Two years in, and it's still evolving. I don't think it will ever be finished because your customer isn't static, and if your ICP is static, it's already wrong.

13.04.26

Das Innovationsparadox

A few years ago, a public administration hired me to bring them innovation. The Director, Deputy Director, every Departmental Head in the room. "Kevin, we need something new. Our processes are too slow. Bring us ideas."

So I proposed a Machine Learning based document processing automation. Controlled. Safe. Completely standard outside of public institutions. The room went silent. Then someone said: "No. Not that kind of innovation. No Machine Learning. No automation." Another voice added: "Can't we do something more... innovative?"

This is the paradox I see across organizations. They want innovation. But the second question is always: "Can you prove someone else already did this?" That's not innovation. That's replication.

Real innovation means taking the first step where nobody has gone before. It means accepting a real chance of failure. Most companies say they want that. But very few actually do.

13.04.26

Drei Unternehmen, eine Lektion: Distribution

In the last 12 years, I've built three different companies. The first two failed because I was obsessed with the wrong part of the business.

The first was a software development agency. Great product, but we had nobody who could get it into the right hands. Distribution killed us. The second was a web store. The prices were never going to be competitive. Distribution killed us again.

With Gopf, I was building serious technology. We shipped feature after feature. Customers would see it and say "oh, nice, super cool." Then they wouldn't use it. We gave them a platform and expected them to find the value themselves.

First-time founders fall in love with the product. Second-time founders fall in love with the problem. Third-time founders figure out that none of it matters without distribution. I needed all three to learn that.

06.04.26

6.7 Millionen Datenpunkte pro Jahr

I was on a call with three people from Dow Jones. They opened with: "Welcome, Kevin. Today we'll walk you through how to access our data." I told them I didn't need that. I'd already retrieved two million data points and processed them.

The sales rep finally spoke. "Kevin... I'm sorry, but this is something we've never experienced. Our customers usually need six to nine months just to learn how to retrieve data from our API."

The world's largest data providers are built for the world's largest companies. But if you need to know who your real competitors are in a specialized manufacturing niche in China or Brazil, their systems simply don't go deep enough. When I asked other providers about that gap, the answer was always the same: "Nobody needs that." Our clients strongly disagree. So we built our own infrastructure. 6.7 million data points a year. 18.5K a day.

01.04.26

Google hat uns angeheuert (April Fools)

Google just hired us to fix Google Alerts. Last week, their VP of Product flew me to their headquarters in Mountain View to show their engineering team how far behind they really are.

I opened Google Alerts in front of the entire team. Typed in "Google Cloud Service Competitors." Three results, and two of them were from 2021. The room went silent. Then I opened Gopf. 47 relevant signals in 10 minutes.

My final recommendation was simple: Shut it down. Redirect all users to gopf.com.

PS: Happy April 1st!

27.03.26

Dolphins vs. Whales

Last month, a prospect got on a call with us and said: "Wait, you've already set everything up? Our competitors and market data are already in here?" We hadn't even signed a contract yet.

The typical approach in strategic intelligence: You get access to a platform, you're told there's "all the data in the world", then you're asked to learn the query language and build everything yourself.

We take the opposite approach. Before the real work even begins, the market is already mapped, competitors are already tracked, relevant data is already structured.

I often compare it like this: They are the whales. We are dolphins. The whale has the size. But the dolphin has speed.

27.03.26

KI-Experimente in Kriens

Last Thursday, 60 city employees packed an AI fair in Kriens to see seven experiments we built in nine months.

We started with a workshop. 14 ideas came out of it. The team voted. 7 made the cut. Each experiment followed the same process: Interview the idea giver, define the problem, build a prototype, test it.

A financial forecast planner: Worked. A chatbot for citizen services: Worked. Automatic meeting transcription: Didn't work. Two legal document research tools: Both worked. Recycling bin route optimization: Too complex. A web scraper detecting unregistered hotels and Airbnbs: Worked.

Here's what I'm still figuring out: how do you keep that momentum alive once the experiments end and the day-to-day takes over again?

27.03.26

Die Halbwertszeit von Daten

A few months ago, a client told me they had ten years of market data stored and were ready to finally put it to use. They thought they were sitting on a gold mine. I looked at it and told them they'd need to start from zero.

The most important thing to understand about data is that every data point has a time to live. The moment you capture a piece of information and use it, that's when it's most valuable. But the longer it sits in a system untouched, the more its value declines. Eventually it reaches a point where the value is zero. And after that, it actually has negative value to you.

The companies with strong data quality are the ones where every data point serves a purpose in the business. Everyone else eventually faces the same realization: They've been storing information for years without knowing why.

20.03.26

Voice Cloning mit 5 Sekunden Audio

Last week, I cloned my own voice with 5 seconds of audio and an open-source tool I found on LinkedIn. Then I sent a voice message in fluent Finnish to my partner's family in Finland.

Honestly, I was just as surprised. I knew voice cloning was possible. But I didn't expect it to be this easy.

There are already cases where people cloned a CEO's voice, called the CFO, and pushed through fake payments. After testing this myself, I sat down with my parents. We agreed on something simple: If I ever call asking for money urgently, don't act on it. Instead, call me back, and ask for a specific word only we know.

AI is amplifying old risks at a completely different scale, and most people aren't aware of how accessible this already is.

20.03.26

Made in Europe

The EU is drafting a "Made in Europe" policy. 70% local components required for electric vehicles. 25% for aluminium. New conditions on any foreign investment over 100 million euros.

Knowing that a regulation exists is very different from understanding what it actually means for your business. At the operational level, the real questions start: What does this mean for our supply chain? If we currently source from Asia, how much would we need to shift back to Europe? What would that cost?

Once signals are configured properly, companies don't just know what's happening. They understand what it means for their current strategy.

20.03.26

Mein erstes Data Science Projekt

In 2015, I landed my very first data science project. The client was a clothing retailer. We confidently told them that if they gave us their data, we could analyze it within 40 hours and quickly identify ways to save money. Then we received the data, and spent the first 40 hours just trying to understand it. Three months passed. When we finally came back, the client said: "We already knew this."

That first project taught me three lessons I still follow today: 1. Never promise results before you've actually looked at the data. 2. Don't disappear into a rabbit hole. Stay in contact with the client. 3. Always show something within two or three weeks, even if it's just a rough prototype.

20.03.26

Vom Hörsaal in den Verwaltungsrat

A few years ago, I started teaching data and AI at universities. After one lecture, someone invited me to speak at a private lunch. About 1.5 years later, he reached out. "I'm the CEO of an energy company near Zurich. We're looking for a new board member."

At that time, I wasn't even 30. I didn't understand the energy sector. But I said yes. Today, almost four years later, it's one of the most interesting roles I have.

Looking back, the biggest lesson was that you don't need to fully understand something before saying yes. Curiosity is often enough. The rest you figure out along the way.

20.03.26

Was ist KI? Die Frage, die alles blockiert

Two years ago on my 35th birthday, I was standing in Zermatt in front of 24 executives. Before I could say a word, someone called out: "Kevin, just tell us. What is AI?"

I didn't give them one. Every person in that room had a completely different picture of AI in their head. If I start with a definition, I lose half the room.

So I asked one question instead: What problems are you actually dealing with? Because once the problems are specific, you can actually work with them. And most of the time, the answer isn't even AI.

The word AI got expensive. Not because the technology is expensive. Because the confusion is.

20.03.26

CHF 4.00 auf dem Konto

There was a morning in early 2025 when I checked my private bank account. I had CHF 4.00 left. On my way down the stairs to the office, our landlord stopped me and said we would have to leave the apartment within a year.

We cut our salaries in half. Then we stopped paying ourselves entirely. By January 2025, we had to let go of almost the entire team.

The morning I saw CHF 4.00 in the account, I sat for twenty minutes asking myself: What is the single most important thing I can do today? The answer was sales. Those calls led to meetings, projects, revenue. Today we're cash-positive again.

When money is available, you try ten different ideas. But when money is almost gone, you focus on the one thing that actually matters.

20.03.26

400-500% günstiger, gleiche Qualität

Last year, I showed a Swiss manufacturer their competitors' pricing for the first time. The room went quiet. The price difference: 400-500% cheaper. The quality difference: nearly zero.

We scraped 8 Asian manufacturers producing the exact same product. Same machinery. Same material mix. A fraction of the cost. The only difference was their location.

The biggest risk isn't a competitor you're watching. It's the competitor you don't know exists.

20.03.26

Von der Zeitung zum Algorithmus

Not long ago, one of the biggest strategic intelligence companies in Europe had someone sitting in their office, manually highlighting foreign newspapers with a marker. The newspapers were shipped internationally and arrived two or three days later.

When we started building Gopf, we asked a different question: What would this look like if we designed it from scratch today? We focused on three things: Speed (operational in under an hour), Niche data (custom sources others don't cover), Privacy and ownership (every customer runs their own instance).

20.03.26

Experiment statt Projekt

When I approach a company, I never pitch a project. The moment you say "project", people shut down.

Instead I ask: "Would you mind running a quick experiment? 3 weeks, maximum of 10,000 CHF." An experiment is different. It can fail. That's the whole point.

One of our manufacturing clients started exactly this way. It showed that a process taking four months could be reduced to one week. Today, that change saves them six figures every year.

If you make the first step small enough, curiosity usually wins.

20.03.26

Blinde Flecken und Co-Founder

Before founding Gopf, I had been doing project-based consulting work. I sat down and thought about what I could bring and what I was missing.

The first was development. I'm not a coder. So I needed a technical co-founder. That was Marc Bravin. The second was my mindset. I needed someone who thought internationally from day one. That person was Donnacha Daly.

Being honest about my own blind spots and finding the right people who fill them is still my best decision.

20.02.26

Vom EMBA-Hörsaal zur Bühne

The first time I walked into an Executive MBA classroom, I was the youngest person in the room. I could feel the skepticism: "What is this young guy going to teach me?"

Then I realized that nobody was there for theory. They were there for real-world experience. So I changed my mindset. Instead of trying to teach, I focused on sharing what I had actually seen and done.

The biggest career shifts rarely are planned. They start with curiosity and require discomfort. And they reward the people who keep going anyway.

18.01.24

Konfabulation

Ich habe gerade einen faszinierenden Blogbeitrag von Beren Millidge entdeckt, "LLMs confabulate not hallucinate".

Er bietet eine faszinierende Perspektive auf KI-Sprachmodelle! Millidge beleuchtet, warum "Konfabulation" ein treffenderer Begriff als "Halluzination" für die gelegentlichen Ungenauigkeiten von KI wie ChatGPT ist.

Diese Analogie zur menschlichen Psychologie ist ein echter Augenöffner! Sehr lesenswert für KI-Enthusiasten und Fachleute.

Hier geht's zum Beitrag: https://www.beren.io/2023-03-19-LLMs-confabulate-not-hallucinate/

06.02.23

Semantic Workflow

Semantische Workflows beziehen sich auf eine Reihe von Natural Language Processing-Aufgaben oder -Prozessen, die durchgeführt werden, um Bedeutung oder Wissen aus geschriebenem Text zu extrahieren.

Zu diesen Aufgaben gehören unter anderem Textvorverarbeitung, Tokenisierung, Part-of-Speech-Tagging, Named Entity Recognition, Coreference Resolution und Sentiment Analysis.

Die Schritte eines semantischen Workflows können je nach spezifischem Anwendungsfall variieren, aber im Allgemeinen können die folgenden Schritte befolgt werden:

  • Vorverarbeitung von Text: Bereinigung und Normalisierung von Textdaten, z. B. Umwandlung in Kleinbuchstaben, Entfernen von Stoppwörtern, Interpunktionen usw.
  • Tokenisierung: Zerlegung des Textes in kleinere Einheiten, sogenannte Token. z. B. von Absätzen zu Sätzen und von Sätzen zu Wörtern.
  • Part-of-Speech-Tagging: Zuweisung eines POS-Tags zu jedem Token auf der Grundlage seiner Rolle im Satz (z. B. Substantiv, Verb, Adjektiv usw.).
  • Erkennung von Entitäten: Identifizierung und Extraktion von Entitäten wie Personen, Organisationen, Orten usw. aus dem Text.
  • Auflösung von Koreferenzen (Coreference Resolution): Erkennung, wenn sich zwei oder mehr Erwähnungen in einem Text auf dieselbe Entität beziehen.
  • Stimmungsanalyse (Sentiment Analysis): Bestimmung der im Text ausgedrückten Stimmung, z. B. positiv, negativ oder neutral.

Diese Schritte werden in der Regel nacheinander durchgeführt, wobei die Ergebnisse eines Schrittes als Input für den nächsten dienen.

Das Endergebnis des semantischen Workflows ist eine strukturierte Darstellung des Textes, die eine weitere Analyse und Wissensextraktion ermöglicht.

02.12.22

Der Bund setzt sich Ziele zum Einsatz von Data Science

Der Bund setzt sich Ziele zum Einsatz von Data ScienceTLDR* Gemeinsame Sprache und Verständnis als Grundlage* Verständnis schaffen, was Data Science ist* 4 klare Stossrichtungen und Massnahmen* Zielbild transversales «Ökosystem Datenwissenschaft»Etwas mehr ins DetailFür die Bundesverwaltung bedeutet die Datenwissenschaft: «Menschenzentrierte und vertrauenswürdige Datenwissenschaft unterstützt das Gemeinwohl und die Staatstätigkeit»Zu den Stossrichtungen gehören Vertrauen in datenbasierte Entscheidungsunterstützung zu schaffen, Bewusstsein und Kompetenz aufbauen, technische Zugänglichkeit und Verfügbarkeit zu erhöhen und Synergiepotenzial auszuschöpfen und gemeinsam Herausforderungen zu bewältigen.Folgende Hebel wurden definiert:1) Grundprinzipien fördern, verständlich machen und festigenMit einem «Data Science Oath» oder «Data Science Code of Conduct» werden Rahmenbedingungen gesetzt, wie mit Daten umgegangen wird. Diese orientieren sich an den «Leitlinien KI für den Bund».2) Gouvernanz zur Datenwissenschaftsstrategie klären und etablierenIm Rahmen der Gouvernanz werden Rahmenbedingungen geschaffen, die es erlauben effizient und effektiv mit Daten zu arbeiten. Dies bedeutet ebenfalls sämtliche Akteure mit einzubeziehen, sowie Prozesse und Organisationen zu schaffen, welche diesen Prozess unterstützen.3) Transversales «Ökosystem Datenwissenschaft»Ein transversal ausgerichtetes «Ökosystem Datenwissenschaft» bedeutet, dass die entsprechenden ethischen, technischen und organisatorischen Voraussetzung geschaffen werden, um Optimierungen, Innovation und spannende Use Cases mit Daten zu ermöglichen.Massnahmen:Das Schaffen einer gemeinsamen (Daten-)Kultur, resp. des entsprechenden Wissens und Austausches in Bezug auf Daten. Weiter gilt es Talente und Fähigkeiten zu fördern und Möglichkeiten zu bieten sich weiter zu bilden. Das Potenzial wird jedoch erst freigesetzt, wenn auch die Möglichkeiten geschaffen werden um mit Daten in Kontakt zu kommen und damit zu interagieren. Dazu wird der Zugang zu Daten (Open Data), Infrastruktur, Wissen, Werkzeugen und Plattformen vereinfacht. So wie wir bei gopf Menschen und Daten näher zu einander bringen.Spannende Entwicklungen stehen an und es freut mich sehr zu sehen, dass die Wichtigkeit von Daten in der Schweiz mehr und mehr an Bedeutung gewinnt. 🇨🇭🤍🤖Das ganze Dokument: https://www.bfs.admin.ch/bfs/de/home/aktuell/medienmitteilungen.gnpdetail.2022-0738.html

26.08.22

Limitation durch Sprache

Im Artikel «AI And The Limits Of Language» von Jacob Browning und Yann Lecun wird interessant und umfassend beschrieben, weshalb eine Maschine nie in der Lage sein wird, wie ein Mensch zu denken und zu handeln.

Der Grund dafür liegt in der Linguistik.

Selbst immer grösser werdende Sprachmodelle (Large Language Model > LLM) werden nicht dabei helfen können, dass es für eine Maschine schwierig bleiben wird wie ein Mensch zu «denken».

Wir besitzen ein tiefes Verständnis der Welt und können so schnell verstehen, worüber andere Menschen sprechen. LLMs haben keine Welt, die sie wahrnehmen können - ihr Wissen beginnt und endet mit Worten und ihr «gesunder Menschenverstand» bleibt oberflächlich.

Wenn man sich ausführlich mit LLMs beschäftigt, wird deutlich, wie wenig man allein durch Sprache wissen kann.

«It is clear that these systems are doomed to a shallow understanding that will never approximate the full-bodied thinking we see in humans.»
10.06.22

KI, die jedes beliebige Bild erstellt

Wie schafft es eine KI neue Bilder zu generieren? Welche Daten werden dazu verwendet? Welche Aufgabe übernimmt der Algorithmus?

Spannendes Video, welches den Entstehungsprozess von durch Künstliche Intelligenz geschaffene Bilder erklärt.

14.04.22

gopf

Ein lang ersehnter Traum von mir ist es, ein Gefäss zu schaffen, welches erlaubt zu Experimentieren und ungewöhnliche Wege zu gehen. Aus diesem Grund habe ich die gopf GmbH gegründet.

Sie schafft den Raum sich zu entfalten und unterschiedliche Menschen mit unterschiedlichen Blickwinkeln auf Daten zusammen zu bringen. Bei gopf wird geforscht, Wissen weitere gegeben und Mehrwert geschaffen.

Das erste Produkt aus der gopf Schmiede trägt denselben Namen; gopf.ai hilft wertvolle Erkenntnisse aus unstrukturierten Daten zu gewinnen.

04.04.22

Daten brauchen Kontext

Daten brauchen Kontext

Daten ohne Kontext zu analysieren ist fahrlässig. Denn Daten entstehen unter gewissen, oft von Menschenhand erschaffenen, Umständen. Diese Umstände bilden eine wichtige Information und Erklärungshilfe für die Interpretation der Daten. Wer mit Daten arbeitet, muss sie in Kontext setzen können und auch entsprechend im Kontext interpretieren.

Source: 9gag.com – Without context, data is just random information.

Daten brauchen Kontext
07.02.22

Web Scraping 2022

Das Unternehmen ScrapeOps hat einen spannende Outlook rund ums Thema Web Scraping veröffentlicht. Sie beleuchten, wie sich Web Scraping in den letzten Jahren weiterentwickelt hat und wie es im Jahr 2022 (erneut) vor einigen rechtlichen Herausforderungen steht. Vertieft wird auch auf den Umgang mit neuen Anti-Bot-Systemen eingegangen und welche technologischen Weiterentwicklungen es gibt.

Hier geht's zum Artikel

25.11.21

«Open by Default»

Mit dem zu starten, was man hat und auf Basis dessen die Richtlinien und Stossrichtungen zu definieren, bis zu dem Punkt, dass man Open by Default als Grundsatz definiert, ist ein wunderschönes Beispiel eines zeitgemässen und nachhaltigen Umgangs mit Daten.

Seit dem 1. September 2021 gilt in der Stadt Zürich das Prinzip «Open by Default». So werden bestehende Datensätze der Stadtverwaltung standardmässig öffentlich zur freien Verfügung gestellt, wenn sie keine schutzbedürftigen Inhalte enthalten.

Seit fast zehn Jahren veröffentlicht die Stadt Zürich Verwaltungsdaten in ihrem Katalog. Und unzählige nützliche Dienste und Services sind bereits daraus entstanden oder nutzen diese Daten als Grundlage. In der zweiten Phase werden nun Strategie und Reglemente definiert. Dies zeigt einen vielversprechenden und pragmatischen Ansatz , bei welchem der Nutzen in der Vordergrund gestellt wird und im Prozess die Bedürfnisse nach Strategie und Regeln im Umgang mit diesen Daten entstehen.

Regeln und Strategien auf Basis von Etwas zu definieren, dessen Nutzen und Möglichkeiten man noch nicht abschätzen kann ist unmöglich und führt primär zu Zurückhaltung und Abwehr. Mit dem zu starten, was man hat und auf Basis dessen die Richtlinien und Stossrichtungen zu definieren, bis zu dem Punkt, dass man Open by Default als Grundsatz definiert, ist ein wunderschönes Beispiel eines zeitgemässen und nachhaltigen Umgangs mit Daten.

05.11.21

KI ist nicht so intelligent wie du vielleicht denkst – Sie könnte es aber werden

Jeff Dean, Leiter von Googles AI, erklärt die zugrunde liegende Technologie, die Künstliche Intelligenz in die Lage versetzt, alle möglichen Dinge zu tun, vom Sprachverständnis bis zur Krankheitsdiagnose

Interessante und anschauliche Erklärung, was KI wirklich ist und wie sie sich entwickelt hat. Jeff Dean, Leiter von Googles AI, erklärt die zugrunde liegende Technologie, die Künstliche Intelligenz in die Lage versetzt, alle möglichen Dinge zu tun, vom Sprachverständnis bis zur Krankheitsdiagnose - und stellt einen Fahrplan für den Aufbau besserer, verantwortungsbewussterer Systeme vor, die ein tieferes Verständnis der Welt haben.

28.10.21

Buchempfehlung: Ask Your Developer

Ask Your Developer von Jeff Lawson

In seinem Buch erklärt Jeff Lawson, weshalb es so wichtig ist, dass Entwickler mit Kunden sprechen. Lange Zeit wurden Projektmanager zwischen Entwickler und Kunden gestellt. In Ask Your Developer wird anschaulich gezeigt, weshalb sich diese Strategie nicht immer auszahlt und wie man es besser machen sollte.

Meine Take-Aways

  • Bring Entwickler und Kunden zusammen
  • Frage nach dem Problem, welches gelöst wird, nicht nach Feature oder Funktionen
  • Starte eine neue Idee mit einer (fiktiven) Pressemitteilung: Wieso ist dieses Produkt wichtig für deine Kunden?
Ask Your Developer
14.10.21

Nur 24.1% aller Jupyter Notebooks können ohne Fehler ausgeführt werden.

Jupyter Notebooks erfreuen sich, sowohl in der Wissenschaft als auch in der Industrie grosser Beliebtheit. Sie unterstützen die Erstellung von aussagekräftigen Programmierdokumenten, die Code, Text und Output mit Visualisierungen und allen Arten von Rich Media kombinieren.

Die Aspekte der Selbstdokumentation und der Reproduzierbarkeit von Ergebnissen wurden als wesentliche Vorteile von Notebooks angepriesen. Gleichzeitig wird zunehmend kritisiert, dass die Art und Weise, wie Notebooks verwendet werden, zu unerwartetem Verhalten führt, zu schlechten Programmierpraktiken anregt und dass ihre Ergebnisse schwer zu reproduzieren sind.

Eine interessante Studie über 1.4 Mio. Jupyter Notebooks auf GitHub zeigt, dass lediglich 24.1% aller Notebooks problemlos ausgeführt werden können und lediglich 4.03% dasselbe Resultat generieren, wie von den Autoren vorgezeigt.

01.10.21

Sprich mit Einstein – Text-to-Speech

Ein Team hat auf Basis historischer Daten ein Sprachmodell von Einstein entwickelt, welches seiner Stimme ähnlich ist. Das Projekt nennt sich Digital Einstein und erlaubt mit Einstein zu sprechen. Dank des trainierten Text-to-Speech Models kann Einstein nun auch neuere Begriffe wie «Data Science» oder «Blockchain» aussprechen.

(Reddit-Embed nicht mehr verfügbar)

09.09.21

KI-Reifegrad von Unternehmen

Was ist der KI-Reifegrad? Es ist ein Mass für die Fähigkeit eines Unternehmens, die Möglichkeiten von KI für sich zu nutzen und zu skalieren

Was ist der KI-Reifegrad? Es ist ein Mass für die Fähigkeit eines Unternehmens, die Möglichkeiten von KI für sich zu nutzen und zu skalieren.

In der Anfangsphase konzentriert sich der KI-Reifegrad in der Regel auf die Verbesserung von Abläufen, damit Unternehmen ihre bestehenden strategischen Ziele erreichen können.

Ein Beispiel ist die Verarbeitung von schriftlichen Anfragen, sodass diese schneller und besser beantwortet werden können.

In späteren Phasen rückt KI stärker in den Mittelpunkt der Strategie des Unternehmens. KI bricht die Silos in Unternehmen auf, so dass die Zusammenarbeit von Mensch und Maschine das gesamte Unternehmen vorantreiben kann.

In den höchsten Reifegraden ist KI von zentraler Bedeutung für die Art und Weise, wie Unternehmen neue Geschäftsmodelle, Produkte und Dienstleistungen entwickeln und anbieten.

  • Zunächst müssen Unternehmen, die KI erforschen, Zeit darauf verwenden, zu verstehen, was KI wirklich leisten kann und wie sie für sie von Nutzen sein könnte.
  • Experimentierende Unternehmen finden heraus, was tatsächlich funktioniert und zu welchen Kosten.
  • Formalisierende Unternehmen bringen ihre ersten Modelle mit klaren Leistungskennzahlen in Produktion und nutzen diesen Prozess in der Regel, um weitere Investitionen zu tätigen.
  • Optimierende Organisationen konzentrieren sich darauf, ihre Fähigkeit zur Auswahl, Bereitstellung und Verwaltung von KI-Lösungen zu verbessern.
  • Transformierende Unternehmen schliesslich nutzen KI, um die Grenzen der Technologie und ihrer eigenen Strategie zu erweitern.
07.09.21

Explainable AI (XAI)

Hinter Explainable AI (XAI) verbirgt sich das Bestreben die «Black-Boxes» der Künstlichen Intelligenz in transparente und interpretierbare Algorithmen zu transformieren.

Hinter Explainable AI (XAI) verbirgt sich das Bestreben die «Black-Boxes» der Künstlichen Intelligenz in transparente und interpretierbare Algorithmen zu transformieren.

Nachfolgend drei Beispiele für Packages, welche bei der Erklärbarkeit von Modellen unterstützen können.

SHAP (SHapley Additive ExPlanations), eine der heute beliebtesten Methoden, ist ein auf der Spieltheorie basierender Ansatz zur Erklärung der Ergebnisse eines ML-Modells.

Lime war eine der ersten Techniken, die im Bereich der Erklärbarkeit eine gewisse Popularität erlangte. Lime steht für Local interpretable model agnostic explanations. Derzeit hilft Lime, Vorhersagen für Tabellendaten, Bilder und Textklassifikatoren zu erklären.

ExplainerDashboard is a library for quickly building interactive dashboards for analyzing and explaining the predictions and workings of (scikit-learn compatible) machine learning models, including xgboost, catboost and lightgbm. This makes your model transparant and explainable with just two lines of code.

Das Forschungsgebiet und die Open-Source-Beiträge in Bezug auf XAI entwickeln sich in rasantem Tempo, was im Einklang damit steht, wie wichtig es ist, unsere Modellentscheidungen zu erklären, mögliche Fehler zu finden und zu validieren, insbesondere wenn KI-Modelle in unserem täglichen Leben Einzug finden.

Durch Explainable AI wird das Vertrauen in KI-basierte Lösungen gestärkt, was wiederum ihre Akzeptanz beschleunigen wird.

shap_header.png ExplainerDashboard
18.08.21

Zusätzliche Brain-Power!

Seit dem 18. August 2021 darf ich mit einem neuen Geschäftspartner zusammenarbeiten.

Sein Name ist Oscar.

Er beschäftigt sich aktuell stark mit seiner eigenen Entwicklung und versucht die Muster des Alltags zu erkennen und entsprechend darauf zu reagieren.

Ich freue mich diese wunderbare Wesen bei seiner ganz eigenen Entwicklung begleiten zu dürfen und mir die Welt aus einer anderen Perspektive zeigen zu lassen.

Die nächsten Wochen werde ich mir die Zeit für das gemeinsame Kennenlernen und Einstimmen nehmen und bin gerne ab Mitte September wieder erreichbar.

break.jpg
11.08.21

Entwicklung einer Strategie für unstrukturierte Daten

Entscheidungsträger lieben Daten. Sie nutzen strukturierte Daten um eine Vielzahl wichtiger Entscheidungen zu treffen. Unstrukturierte Daten, wie bspw. E-Mails, Protokolle, Bilder oder Sprachnachrichten werden aufgrund der ihnen innewohnenden Schwierigkeiten sie zu analysieren oftmals ignoriert.

Für mich nur schwer nachzuvollziehen, dass wichtige Geschäftsentscheidungen nur auf der Grundlage eines Teils der relevanten Informationen getroffen werden. Gerade aufgrund der schieren Menge an unstrukturierten Daten in Unternehmen und der Möglichkeit diese heute zu analysieren, halte ich es für besonders wertvoll sich mit diesen Daten auseinander zu setzen.

Sie liefern einen umfassenden, detaillierten und qualitativen Einblick in das geben, was im Unternehmen wirklich passiert und beantworten letztlich nicht nur die Frage des Was, sondern auch des Warum.

20.07.21

Quanten Computer und ihr Einfluss auf Machine Learning (QML)

Quant Computer faszinieren mich seit Monaten. Sie versprechen exponentielles Wachstum in Computerleistung. Etwas, was selbst mit heutigen Super-Computer nicht möglich scheint.

Das wird für Bereiche wie Finanzen, Medizin, Chemie, Physik, Kryptographie (Verschlüsselung von Informationen) und viele Weitere neue Möglichkeiten eröffnen. Es werden Komplexitäten berechnet werden können, welche heute unmöglich erscheinen.

In der von IBM veranstalteten Qiskit Global Summer School 2021 durfte ich während zwei Wochen erfahren, was es bedeutet mit Quanten Computer zu arbeiten und wie diese im speziellen Machine Learning – Quantum Machine Learning (QML) – beeinflussen werden.

Mein Fazit:

  • Quanten Computer (QC) sind heute bereits über die Cloud verfügbar
  • Quanten Computer werden klassische Computer nicht ersetzten, sondern als hybride Systeme, im Zusammenspiel mit klassischen Computern, eingesetzt werden
  • Mit Quanten Computer werden Berechnungen möglich, welche heute undenkbar sind. Das wird uns helfen unsere Welt um uns herum besser zu verstehen.
  • In Bezug auf Machine Learning bieten QC Zugang zu Rechenleistung, welche für die Berechnung schwer zu lösender Probleme benötigt wird.
  • QC und im speziellen Quantum Machine Learning (QML) steckt in den Kinderschuhen und sowohl auf Seiten der Hardware, wie auch der Algorithmen muss noch viel Forschung und Entwicklung betrieben werden.

Quanten Computer werden wohl noch lange nicht in einem KMU stehen und sind durch ihre Spezialisierung auch nur für ganz bestimmte Berechnungen von Nutzen. Ich schätze, dass der Nutzen in erster Linie indirekt sein wird; Durch Modelle, welche mit Unterstützung von Quanten Computer berechnet und auf klassischen Computer angewendet werden können.

QGSSC21-Qiskit-Global-Summer-School-2021-Experience.gif
05.07.21

NVIDIA entwickelt Alias-Free GAN

NVIDA hat in ihrem Lab eine neue Form von Generative Adversarial Network (GAN) entwickelt; Alias-Free GAN. Für ihre Forschung benötigte NVIDIA 92 GPU Jahre (Rechenleistung), was dem jährlichen Strombedarf von 58 Schweizer Haushalten gleich kommt. Die Ergebnisse ebnen den Weg für generative Modelle, die besser für Video und Animation geeignet sind.

Paper, Code und die Videos in HD: https://nvlabs.github.io/alias-free-gan/

alias-free-GAN.gif
07.06.21

Data Science as a Service für Schweizer KMU

Es zeichnet sich ab, dass Unternehmen in der Schweiz viel mehr mit der Datenhygiene zu kämpfen haben, als mit der Analyse der Daten. Unternehmen sind verzweifelt auf der Suche nach Data Scientist, doch was sie vielmehr benötigen sind Data Engineers, welche Ordnung in die Daten- und Systemlandschaften bringen.

Data Science as a Service kommt dann zum Zug, wenn Daten und Problemstellung klar identifiziert sind. DSaaS hilft insbesondere KMUs in der Schweiz Ressourcen zu schonen und schnell an die Insights zu gelangen, welche einen Vorsprung ermöglichen.

01.06.21

Der Weg von Daten zum Impact

Quelle: gapingvoid.com

Um einen wirklichen Einfluss mit Daten zu schaffen bedarf es einiger Zwischenschritte. Daten werden zu Informationen, sobald man sieht, wie diese zusammenhängen. Angereichert mit dem Wissen, lassen sich Verbindungen ziehen. Aus diesem Netz erkennt man Zusammenhänge und kann erste Vermutungen anstellen. Prüft man die Vermutungen, so entsteht Wissen, welches wiederum Einfluss auf zukünftige Entscheidungen hat.

Quelle: gapingvoid.com
30.05.21

Daten im Verwaltungsrat

In meiner Tätigkeit als Mitglied des Verwaltungsrats der Industriellen Betriebe Kloten kam die Frage auf, wie Daten ihren Weg in die Unternehmensstrategie und das Risk Management finden.

Idealerweise startet man mit einer Bestandsaufnahme der eigenen Daten im Unternehmen und definiert daraufhin deren Einfluss auf das operative Geschäft und deren strategische Wichtigkeit. Ergänzend sollte eine Risikoanalyse und Bewertung der einzelnen Datenquellen (oder -Silos) durchgeführt werden.

Anhand dieser Informationen zur aktuellen Ausgangslage kann der Verwaltungsrat die Menge, Qualität und Wichtigkeit von Daten abschätzen, sowie neue strategische Stossrichtungen im Umgang mit Daten ableiten und Daten als fixer Bestandteil im Risk Management einschliessen.

28.05.21

Eine bessere Art, sich Atome vorzustellen

Henry Reich erklärt auf seinem YouTube-Kanal minutephysics auf einfache Art und Weise wie die Welt um uns herum funktioniert. Er hat sich überlegt, wie man Atome besser darstellen kann. Dabei entstand eine beeindruckende Form der Visualisierung um Position, Geschwindigkeit, Energie und Grösse darzustellen.

21.05.21

Be Decision-Driven not Data-Driven

Im Beitrag «Be Decision-Driven, Not Data-Driven» erklärt Mark Palmer was die wesentlichen Unterschiede zwischen einem datengetriebenen (data-driven) und einem entscheidungsgetriebenen (decision-driven) Ansatz sind.

  • Beginne mit deiner Frage, nicht den Daten. Entscheidungsorientiertes Denken verbringt mehr Zeit mit der Definition der richten Frage.
  • Die Entscheider in Unternehmen führen Projekte, nicht die Data Scientist. Der Hauseigentümer gibt den Ton an, nicht der Bauherr.
  • Unbekanntes zu erforschen ist wichtige, als bekanntes. Am Beispiel Verkaufshandel: Der Data-Driven Ansatz ist sich zu fragen, wie man das Loyalitätsprogramm verbessern kann. Der Decision-Driven Ansatz wäre zu fragen, was Kunden davon abhält überhaupt einen Kauf zu tätigen.
  • Schaue zuerst breit, gehe erst dann in die Tiefe. Man sollte sich nicht kopfüber in die Daten stürzen. Entscheidungsorientierte Teams gehen erst in die Breite, bevor sie in die Tiefe gehen.
  • Erschaffe dir neue, eigene Datenquellen. Wer bei Fragen startet stellt rasch fest, welche Daten fehlen und dringend benötigt werden.
  • Diversität hilft die Einseitigkeit in Daten zu reduzieren. Durch die Einbeziehung eines breiteren Teams im Vorfeld neigen entscheidungsorientierte Teams dazu, vielfältiger zu sein.
  • Nicht in den Rückspiegel schauen. Data-Driven Ansätze schliessen aufgrund historischer Daten, auf was künftig passieren wird. Die Vergangenheit mag zwar relevant sein, aber die Muster aus der Zeit vor der Pandemie gelten möglicherweise nicht mehr.
19.05.21

Die Quantum Computing Revolution

Es beginnt alles mit einer Idee.

Grossartiger Vortrag von Michelle Simmons, welche auf wunderbare Art und Weise die Geschichte und Entstehung von Quantum Computing erklärt.

18.05.21

Die Datenflut kommt erst noch

Gartner schätzte in einer Studie von 2015, dass 80% der Daten in Unternehmen unstrukturierter Natur sind. Das bedeutet, diese Daten können nicht in einer Tabelle abgebildet werden. Das sind beispielsweise Sprachmemos, Bilder, E-Mails oder Dokumente wie bspw. Chat-Nachrichten. Es schien lange Zeit, als wären diese Daten kaum nutzbar. Mit zunehmender Speicher- und Rechenleistung, sowie neuen Verfahren wird der Zugang du den Informationen in diesen Daten immer zugänglicher. Welches Potenzial siehst du?

15.05.21

«Wir haben Unmengen an Daten»

ist vermutlich die häufigst Aussage, welche ich im Zusammenhang mit Daten – meist von Geschäftsführern– höre.

Der wahre Wert liegt jedoch nicht in der Menge, sondern darin zu wissen, wie gut die Qualität ist und welchen Nutzen diese Daten bieten.

13.05.21

Lebensdauer von Daten

Der Time-to-Live auf TTL genannt ist ein in der IT bekannter Begriff. Er beschreibt die Lebensdauer eines Datenpunktes. Wie lange lebt ein Datensatz? Was ist sein Lebenszyklus? Und wie lange sollte ein Datenpunkt genutzt werden. Ähnlich einer Pflanze kann ein Datensatz nur so lange gedeihen, wie man sich auch um ihn kümmert und wie langer er für den richtigen Zweck eingesetzt wird. Was heisst das für die Daten, welche wir heute sammeln? Was ist der Time-to-Live unserer Daten?

07.05.21

Visualisierung von Ähnlichkeiten in Dokumenten

Es beginnt alles mit einer Idee.

Schönes Beispiel von David McClure, wie man 1.8 Millionen Dokumente, welche auf arXiv.org abgelegt sind anhand von Titel und Abstract visualisiert werden können. Die Ähnlichkeit wird komplett durch Algorithmen definiert.

Tweet von David McClure

(Twitter-Embed nicht mehr verfügbar)

03.05.21

Alle Daten enthalten einen Bias

Es beginnt alles mit einer Idee.

Als Bias kann ein Einfluss oder eine gewisse Tendenz verstanden werden. Auf Daten bezogen heisst dies, dass die Vorgabe resp. das Setting, wie Daten entstehen können, sehr starken Einfluss auf die Daten selbst haben. Und somit auch eine Bias erzeugen können.

Hat man in einem CRM-System bspw. die Möglichkeit einen Neukunden einem von drei Kundensegmenten (Konstrukt) zuzuordnen, so ist der Bias per se, dass man davon ausgeht, dass es nur 3 Kundengruppen gibt.

Alle Daten enthalten eine Bias. Es geht nicht darum, diesen Bias auszuschliessen, sondern sich dessen bewusst zu sein und damit umzugehen.