• Product Craft
  • Posts
  • [F4T] Użytkownicy mają gdzieś, że jesteście „produktem AI”, wpływ Product Trio, problemy z Deep Research

[F4T] Użytkownicy mają gdzieś, że jesteście „produktem AI”, wpływ Product Trio, problemy z Deep Research

3 materiały, które mnie mocno zainspirowały w marcu 2025 i trafiły do mojej prywatnej bazy wiedzy.

Dzisiaj w newsletterze kolejne produktowe „Food 4 Thoughts” [F4T], czyli 3 materiały, które mnie zainspirowały w ostatnim czasie i finalnie trafiły do prywatnej „bazy wiedzy”. Z najciekawszych treści robię sobie zawsze notatki na przyszłość 📝 - znajdziesz je poniżej: 

  • 1️⃣ Użytkownicy mają gdzieś, że jesteście „produktem AI”. Nie warto podążać z trendem labelowania wszsytkiego jako AI.

  • 2️⃣ Wpływ pracy w Product Trio na zespół produktowy - wyniki ankiety

  • 3️⃣ Problem z „Deep Research” od OpenAI - ta funkcja powinna być dla nas wybawieniem w researchu, ale…

Smacznego!

1️⃣ Użytkownicy mają gdzieś, że jesteście „produktem AI”

Wszyscy wypuszczają nowe ficzery AI, każdy produkt to teraz "produkt AI”. Produkty prześcigają się w podkreślaniu na landing page’ach i przekazie marketingowym jak bardzo są “AI powered”.

Czy warto podążać za tym trendem? Otóż niekoniecznie ❌.

Growth Unhinged przeprowadził eksperyment, w którym sprawdził jak użytkownicy reagują na podkreślanie, że jest się produktem AI.

Uczestnicy badania otrzymali do przejrzenia landing page czterech rzeczywistych produktów wykorzystujących sztuczną inteligencję.

Przykład testu dla Zendeska

  • Wersja A - w tej wersji leandinga podkreślano obecność AI, używając określeń takich jak „napędzane AI” czy „LLMs”.

  • Wersja B - W drugiej wersji skupiono się wyłącznie na funkcjach i korzyściach produktu, pomijając bezpośrednie odniesienia do AI.

Co się okazało? Jakie były wniki eksperymentu?

  • 🔹 Niższe oczekiwań względem produktów AI: Zamiast wzmacniać pozytywne skojarzenia, określenia siebie jako „produkt AI” faktycznie obniżyło oczekiwania co do potencjalnej wartości produktu.

  • 🔹 Brak wpływu gotowość do zapłaty (WTP - Willingness to Pay): Samo oznaczenie produktu jako „napędzanego AI” nie wystarcza, by uzasadnić wyższą cenę. Użytkownicy nie są skłonni płacić więcej, jeśli narzędzie nie oferuje jednoznacznych i przekonujących korzyści.

  • 🔹 Brak wpływu na zaufanie do produtku - W przypadku większości marek wyraźne wspominanie o sztucznej inteligencji nie zwiększyło zaufania klientów do niezawodności narzędzia.

Krótko mówiąc: hype wokół AI nie wystarczy. Liczy się realna wartość. 🚀

2️⃣ Wpływ pracy w Product Trio na zespół produktowy

Interdyscyplinarna współpraca to mega wyzwanie - ogarnięcie zainteresowanych, zgranie różnych perspektyw, budowanie zaangażowania mimo róznych POV. I to wszystko zajmuje cholernie dużo czasu.

Kiedy jednak zwolnimy, posłuchamy zaintersowanych, ludzie są zwyczajnie bardziej zadowoleni. Dlatego sam jest wielkim fanem Product Trio w zespołach produktowych.

Teresa Torres rzuciła właśnie trochę światła na to jak pracujemy w swoich produktowych Trio - opublikowała wyniki swojej ankiety “2024 CDH Benchmark Survey” na 680 produktowcach.

  • 🔹 Praca w ramach Product Trio wiąże się z wyższym poziomem satysfakcji z zespołu i firmy. Im więcej czasu ludzie spędzali ze swoim Product Trio, tym bardziej byli zadowoleni. Wyniki te są spójne z poprzednim badaniem z 2022 roku.

  • 🔹 62,8% respondentów zadeklarowało pracę w ramach Product Trio - tu trzeba jednak zaznaczyć, że liczba ta prawdopodobnie nie odzwierciedla stanu całej branży ze względu na to że dużo osób ze społęczności Teresy Torres brało udział w ankiecie. W naszej ankiecie Stan product managementu w Polsce - wyniki ankiety - mieliśmy wynik 50%.

  • 🔹 Product Trio składa się zazwyczaj z product managera, designera i inżyniera. Dane potwierdzają to założenie - 68,4% respondentów pracujących w Product Trio wskazało, że ich zespół składa się dokładnie z tych ról.

  • 🔹 Średnio członkowie Product Trio spędzają razem 3-5 godzin tygodniowo na wspólnej pracy.

Ja się cieszę, że te dane sa dość zbieżne z naszymi wynikami z Stan product managementu w Polsce - wyniki ankiety .

3️⃣ Problem z „Deep Research” od OpenAI

Benedict Evans wziął na warsztat nową zabawkę od OpenAI - Deep Research w ChatGPT. Zapowiada się super, bo kto z nas, product managerów i headów of product, nie marzy o narzędziu, które ogarnie za nas ten ciągły research i analizę? Przekopywanie danych, składanie ich w sensowne całości, wyciąganie insightów…

Evans, opierając się na swoim bogatym doświadczeniu (zajmuje się rynkiem mobile od 20 lat, był partnerem w fundusz Andreessen-Horowitz), przetestował tę funkcję na przykładzie raportu OpenAI dotyczącego rynku smartfonów.

Na pierwszy rzut oka wszystko wyglądało pięknie, ale po sprawdzeniu raportu jest cała masa błędów. Weźmy taką tabelkę z udziałami systemów operacyjnych na różnych rynkach:

❌ Powierzchowne źródła i nieprecyzyjne dane

Na pierwszy rzut oka - godziny mozolnego zbierania danych w jednym miejscu. Problem tkwi w źródłach danych - Statcounter i Statista.

Każdy, kto choć trochę siedzi w analizach rynkowych, wie, że Statcounter to miernik ruchu, a niekoniecznie adopcji (iPhone'y generują większy ruch, więc zawyżają wyniki iOS). Statista z kolei to agregator danych, często ukrytych za paywallem. Powołanie się na Statista jako źródło to trochę jak powiedzieć, że źródłem jest "wynik wyszukiwania w Google". Błąd na poziomie stażysty, jak celnie zauważa Evans.

❌ Błędy merytoryczne

Ale to dopiero początek zabawy. Spójrzmy na Japonię. Deep Research twierdzi, że tam iOS ma 69%, a Android 31% rynku. Evans zadaje dwa kluczowe pytania: czy to w ogóle wynika z tych "źródeł" i czy te "źródła" mają rację?

Okazuje się, że Statcounter w ogóle nie podaje takich danych od ponad roku. A Statista? Po przeklikaniu się przez tonę formularzy, znajdujemy, że prawdziwym źródłem jest firma badawcza Kantar Worldpanel, która podaje… dokładnie odwrotne liczby: 63% Android i 36% iOS. Ups.

I tu mam clue problemu? Jeśli musisz weryfikować każdą daną w tabeli, to cała „oszczędność czasu" dla eksperta idzie do kosza. Równie dobrze możesz zrobić to samemu od początku. Dla ciekawostki Evans sprawdził, że japoński regulator podaje jeszcze inne dane (około 53% Android i 47% iOS).

❌ Problem z determinizmem

Evans zwraca uwagę na fundamentalną różnicę między probabilistyczną naturą LLM-ów a deterministyczną potrzebą precyzyjnych danych w researchu. Zadajemy modelowi probabilistyczne pytanie ("jak wygląda adopcja?"), ale oczekujemy deterministycznej odpowiedzi (konkretnej liczby z wiarygodnego źródła), i tutaj model zawodzi.

📌 Wnioski dla product managerów:

  • LLM-y to nie bazy danych: nie oczekuj od nich precyzyjnego i deterministycznego wyszukiwania informacji. Ma to szczególe znaczenie przy danych liczbowych.

  • Nieprecyzyjne pytanie = nieprecyzyjna (ale deterministyczna!) odpowiedź

    • Przykładowo pytanie ChatGPT o "adopcję" jest bardzoe ogólne. Czy chodzi o sprzedaż, aktywną bazę użytkowników, udział w ruchu? To różne rzeczy.

    • Problem jest taki, że nawet jeśli sprecyzujesz pytanie i wybierzesz "właściwe" źródło, oczekujesz konkretnej, deterministycznej liczby. I tu właśnie model zawodzi, podając błędne dane nawet z wybranych przez siebie źródeł.

  • "Prawie dobrze" nie wystarczy: W głębokim researchu i analizie błędy mają znaczenie. Jeśli tabela zawiera nieścisłości, nie możesz jej zaufać, niezależnie od tego, jak wiele danych jest poprawnych.

AI to Twój "stażysta": To celne porównanie. AI może przyspieszyć pewne zadania w researchu, ale wymaga ciągłego nadzoru, weryfikacji i "uczenia". Nie zastąpi (na razie jeszcze) eksperckiej wiedzy i krytycznego myślenia.

BTW. Jak masz coś (artykuł, link, video), co Ciebie zainspirowało mocno w ostatnim miesiącu - podeślij, chętnie przyjmę 🙂 

Reply

or to participate.