ChatGPT von OpenAI, Googles Bard und PI von Inflection AI sind drei AI-Modelle, die im Wettbewerb zueinander stehen. Wir werfen einen Blick drauf, wie sich die Modelle bei einer recht einfachen Fragestellung schlagen und wie Bard aus der Reihe fällt.
Problemstellung
Microsoft möchte Activision Blizzard für 95 USD pro Aktie übernehmen. Am 13. Juli 2023 steht die Aktie bei 89,54 USD. Wieviel Prozent müsste die Activision-Aktie also steigen, damit sie die 95 USD erreicht, die Microsoft für das Papier zu bieten gewillt ist.
Pi
Pi ist das erste Modell, das wir uns ansehen. Das AI-Modell von Inflection AI haben wir uns vor kurzem angesehen.
Frage: „If I have 89.54 USD but would like to get to 95 USD. How much is the percentage?“
Antwort von Pi: „In order to calculate the percentage change from 89.54 USD to 95 USD, we first need to determine the absolute change in dollars, which is 5.46 USD. Then, we need to divide the absolute change by the initial amount (89.54 USD), and multiply by 100 to get the percentage change. The percentage change would be 6.09%.“
Das stimmt, denn die Gegenprobe 89,54 USD x 1,0609 ergibt recht genau 95 USD. Pi hat also eine Antwort auf unsere Frage
Bard
Auch Bard haben wir uns vor kurzem angesehen, denn schließlich ist Googles Antwort auf ChatGPT erst seit Mitte Juli 2023 in Deutschland verfügbar. Stellen wir die Frage auch Bard und prüfen die Antwort.
Frage: „If I have 89.54 USD but would like to get to 95 USD. How much is the percentage?“
Antwort von Bard: „Sure, I can help you with that.
To calculate the percentage increase from 89.54 USD to 95 USD, we can use the following formula:
(new value – old value) / old value x 100
In this case, the new value is 95 USD and the old value is 89.54 USD. So, the formula would look like this:
(95 USD – 89.54 USD) / 89.54 USD x 100
This gives us a percentage increase of 5.6%.
To put it another way, if you start with 89.54 USD and increase it by 5.6%, you will end up with 95 USD.
I hope this helps!“
Well, no, to be honest. Der Rechenweg, den Bard uns aufzeigt ist zweifellos richtig. Wie das Modell allerdings auf 5,6 % kommt, ist etwas rätselhaft. Rechnet man „(95 USD – 89.54 USD) / 89.54 USD x 100“ aus, erhalten wir 6,09783337056 als Ergebnis. 89,54 USD x 1,0609783337056 ergibt ziemlich genau 95 USD. Bard aber meint 5,6 % sei das Ergebnis der Aufgabenstellung. Das überzeugt nicht.
ChatGPT
Kommen wir zum Platzhirsch ChatGPT und sehen uns an, wie der sich bei der Problemstellung macht.
Frage: „If I have 89.54 USD but would like to get to 95 USD. How much is the percentage?“
Antwort von ChatGPT: „If you currently have $89.54 and want to get to $95, you are looking to increase the amount you have by a certain percentage.
To find that percentage, you need to determine the difference between the two amounts and then divide that difference by your original amount.
Here’s how you can calculate it:
- Find the difference: $95 – $89.54 = $5.46
- Divide the difference by the original amount: $5.46 / $89.54 = 0.061
- Multiply by 100 to convert to percentage: 0.061 x 100 = 6.1%
Therefore, you need an increase of approximately 6.1% to go from $89.54 to $95.“
ChatGPTs Antwort ist 6.1%, was eine gute Annäherung ist. OpenAIs Modell nennt uns also die richtige Antwort.
Fazit
In unserem Vergleich von ChatGPT, Bard und Pi bei einer einfachen Berechnung hat sich gezeigt, dass alle Modelle in der Lage sind, die grundlegende Mathematik hinter der Frage zu verstehen und die richtigen Berechnungswege aufzuzeigen. Jedoch sind die Ergebnisse unterschiedlich.
Pi von Inflection AI und ChatGPT von OpenAI zeigten sehr ähnliche Ergebnisse, die die gestellte Frage korrekt beantworteten. Beide Modelle kamen auf eine notwendige prozentuale Steigerung von etwas über 6% um von 89,54 USD auf 95 USD zu kommen.
Bard von Google dagegen, lieferte ein anderes Ergebnis. Obwohl der Rechenweg, den das Modell präsentierte, korrekt war, kam es zu einem abweichenden Ergebnis von 5,6%. Dies zeigt, dass, obwohl Bard ein fortschrittliches KI-Modell ist, Fehler auftreten können.
Dieser Vergleich verdeutlicht, dass KI-Modelle unglaubliche Werkzeuge sind, die uns helfen können, Probleme zu lösen und Informationen zu verarbeiten. Sie sind jedoch nicht unfehlbar und sollten immer als ein Tool unter vielen in unserem Arsenal betrachtet werden.
Letztendlich sind Pi und ChatGPT in diesem Test die zuverlässigeren Modelle. Aber es ist jedoch wichtig zu betonen, dass dies nur ein kleiner Aspekt ihrer umfangreichen Fähigkeiten ist. Bard hat sicherlich andere Stärken und wird mit weiteren Updates und Verbesserungen auch in diesem Bereich präziser werden.