Press Kit

Are you writing an article about Ambiverse or citing us? Please use the material provided below.

Logo

Press Releases

Von den Panama Papers zum eigenen Nachrichtendienst für das Unternehmen

Oktober 12, 2016

Im April 2016 veröffentlichen weltweit über hundert Zeitungen, Fernsehstationen und Online-Medien neue Erkenntnisse zu Steuervermeidung und Steuerhinterziehung. Sie basieren auf den „Panama Papers“, einer Datenmenge, die 2,6 Terabyte an Informationen und 11,5 Millionen Dokumente umfasst. 2015 hatte man diese der Süddeutschen Zeitung zugespielt, eine internationale Journalistengruppe wertete sie über ein Jahr hinweg aus. Nun haben Informatiker der Max-Planck-Ausgründung „Ambiverse“ die Daten in nur wenigen Stunden mit einer neuartigen Software analysiert und dabei neue Resultate erhalten. Eigentlich soll die Software Unternehmen helfen, große Textmengen automatisch zu analysieren.

Während die internationale Journalistengruppe die Panama Papers in die Tiefe analysierte und sich auf Personen wie Nawaz Sharif, Premierminister von Pakistan, oder Petro Poroshenko, Präsident der Ukraine, fokussierte, gingen die jungen Gründer mit ihrer neuartigen Software in die Breite. Sie fanden heraus, dass beispielsweise nicht Politiker die größte Gruppe bildeten, sondern Sportler. Sie machten mehr als 20 Prozent der von der Software identifizierten Personen aus, dicht gefolgt von Künstlern. Erst dann kamen die Politiker. Die Fähigkeit der Software, automatisch Kategorien zu bilden, lieferte noch weitere Einblicke. Unter den Sportlern waren es die Fußballer, die sich am häufigsten mit Strategien zur Steuervermeidung und Hinterziehung auseinandersetzten. Den zweiten Platz belegten Tennis- und Basketballspieler mit rund zehn Prozent, Hockey- und Volleyballspieler nahmen mit rund fünf Prozent den dritten Platz ein. Auch zu den Politikern gab es noch eine neue Erkenntnis: Die politische Ideologie beeinflusst nicht die Entscheidung, ein Offshore-Konto zu verwenden. Konservative und sozialistische Politiker tauchten zu gleichen Teilen in den Panama Papers auf.

„Es ist schade, dass wir nur mit den vom ‚International Consortium of Investigative Journalists‘ zur Verfügung gestellten und bereits aufbereiteten Daten arbeiten konnten. Denn unser System kommt nicht nur mit Rohdaten klar, es erzielt dann sogar noch bessere Ergebnisse“, erklärt Johannes Hoffart, der über die zugrundeliegende Technologie an der Universität des Saarlandes promovierte. Zusammen mit vier weiteren Max-Planck-Forschern hat er vor knapp einem Jahr das Unternehmen „Ambiverse“ gegründet, um die Technologie zu vermarkten. Ähnlich wie Nachrichtendienste ein Heer von Analysten vorhalten, um öffentlich zugängliche Texten auszuwerten, können Unternehmen dies mit der Ambiverse-Software in wenigen Minuten tun.

Die Software ist unter anderem deswegen so stark, weil sie nicht nur nach einem Begriff sucht, sondern beispielsweise bei der Suche nach „Angela Merkel“ auch Texte findet, in denen die Bundeskanzlerin lediglich „Angie“ oder „CDU-Chefin“ genannt wird. Gleichzeitig verwirft das Programm alle Dokumente, die sich auf den bekannten Fußballtrainer mit gleichem Nachnamen beziehen. So können Unternehmen Personen, Orte und Produkte in großen Textmengen finden, selbst wenn dies durch mehrdeutige Begriffe oder Abkürzungen erschwert wird. Die Kategoriensuche ermöglicht es sogar, nach „Finanzunternehmen“ oder „Fußballern“ zu recherchieren, ohne diese genauer spezifizieren zu müssen. Zusätzlich lässt sich die Software neben deutschen und englischen Texten, auch auf spanische und chinesische anwenden. Möglich macht dies eine am Max-Planck-Institut für Informatik entwickelte Wissensdatenbank, die sich ihr Wissen unter anderem mit Hilfe der Online-Enzyklopädie Wikipedia erarbeitet. Mit ihrem Geschäftsplan haben die Gründer von Ambiverse vor wenigen Tagen den überregionalen Businessplanwettbewerb „1,2,3, GO“ gewonnen.

Big Data for Text: Next-Generation Text Understanding and Analysis

March 7, 2016

News portals and social media are rich information sources, for example for predicting stock market trends. Today, numerous service providers allow for searching large text collections by feeding their search engines with descriptive keywords. Keywords tend to be highly ambiguous, though, and quickly show the limits of current search technologies. Computer scientists from Saarbrücken developed a novel text analysis technology that considerably improves searching very large text collections by means of artificial intelligence. Beyond search, this technology also assists authors in researching and even in writing texts by automatically providing background information and suggesting links to relevant web sites.
Ambiverse, a spin-off company from the Max Planck Institute for Informatics in Saarbrücken, will be presenting this novel technology during CeBIT 2016 in Hannover from 14 to 18 March at Saarland’s research booth.

Living in the age of business smartphones and enterprise chatrooms, most information in companies is not distributed via spoken words but rather through e-mails, databases, and internal news portals. “According to a survey by the market analyst Gartner, a mere quarter of all companies are using automatic methods to analyze their textual information. By 2021, Gartner predicts 65 per cent will do so. This is because the amount of data inside companies is continuously growing and hence, it becomes more and more costly to have it structured and to search it successfully,” says Johannes Hoffart, a researcher at the Max Planck Institute for Informatics and founder of Ambiverse. His team developed a novel text analysis technology for analyzing huge amounts of text where massive computing power and artificial intelligence (AI) are continuously “thinking along” in the background.

“For analyzing texts, we rely on extremely large knowledge graphs which are built upon freely available sources such as Wikipedia or large media portals on the web. These graphs can be augmented with domain- or company-specific knowledge, such as product catalogs or customer correspondences,” says Hoffart. By applying complex algorithms, these texts are screened further and analyzed with linguistic tools. “Our software then assigns companies and areas of business to their corresponding categories, which allows us to gather valuable insights on how well one’s own products are positioned in the market in comparison to those of the competitors,” he explains. Particularly challenging hereby is the fact that product or company names are anything but unique and tend to have completely different meanings in different contexts, making them highly ambiguous.

“Our technology helps to map words and phrases to their correct objects of the real-world, that way resolving ambiguities automatically,” explains the computer scientist. “Paris” for example stands for the city of light and the French capital, but also for a figure from Greek mythology or a millionfold-mentioned party girl with German ancestors – always depending on context. “Efficiently searching huge text collections is only possible if the different meanings of a name or a concept are correctly resolved,” says Hoffart. The smart search engine developed by his team continuously learns and improves over time, and also automatically associates new text entries to matching categories. “These algorithms are hence attractive for companies that analyze online media or social networks to measure the degree of brand awareness for a product or the success of a marketing campaign,” says Hoffart further.

At CeBIT, Ambiverse will further present a smart authoring platform that assists authors in researching and writing texts. Users who enter texts are automatically provided with background information, for example company-internal guidelines and manuals or web links. “Relevant concepts are linked automatically and links for further research are shown” says the computer scientist.

Visitors to the Ambiverse CeBIT booth (hall 6, booth 28) will also have the opportunity to compete with their novel AI technology by playing a question-answering game. Ambiverse is funded by the German Federal Ministry for Economic Affairs through an EXIST Transfer of Research grant.

Wenn die Suchmaschine mitdenkt und riesige Textbestände automatisch analysiert

7. März 2016

Wer den Aktienkurs eines Unternehmens vorhersagen will, wertet dafür Nachrichtenportale und soziale Medien aus. Für diese Recherche gibt es mittlerweile viele Dienstleister, die ihre Suchmaschinen mit passenden Schlagworten füttern. Sie stoßen jedoch schnell an Grenzen, wenn mehrdeutige Begriffe nur in schwammig formulierten Zusammenhängen erscheinen. Saarbrücker Informatiker haben daher eine Technologie entwickelt, die mit Hilfe von Künstlicher Intelligenz die Suche in großen Textbeständen wesentlich verbessert. Das neue Verfahren unterstützt auch Autoren bei der Recherche und beim Schreiben von Texten, indem es automatisch Hintergrundinfos anzeigt und passende Weblinks vorschlägt.
Die Firma Ambiverse, eine Ausgründung des Max-Planck-Instituts für Informatik in Saarbrücken, stellt die neue Technologie vom 14. bis 18. März auf der Computermesse Cebit in Hannover am saarländischen Forschungsstand vor (Halle 6, Stand 28).

Auch im Zeitalter von Diensthandys und firmeninternen Chatrooms werden die meisten Informationen in Unternehmen nicht über das gesprochene Wort, sondern über Mails, Datenbanken und interne Newsportale ausgetauscht. „Laut einer Marktanalyse des Medienunternehmens Gartner nutzen derzeit jedoch nur ein Viertel der Unternehmen weltweit automatisierte Methoden, um ihre Textbestände zu analysieren und besser zu verstehen. In fünf Jahren werden es nach Gartners Schätzungen mehr als die Hälfte sein, da die Datenmengen in Firmen kontinuierlich wachsen und es immer aufwändiger wird, diese sinnvoll zu strukturieren und mit Erfolg zu durchsuchen“, sagt Johannes Hoffart, Forscher am Max-Planck-Institut für Informatik und Gründer der Firma Ambiverse. Sein Team hat daher eine Technologie für die Analyse von großen Textbeständen entwickelt, bei der viel Rechenpower und Künstliche Intelligenz im Hintergrund buchstäblich „mitdenkt“.

„Wir greifen bei unseren Textanalysen auf frei verfügbares Wissen zurück, zum Beispiel auf Wikipedia oder große Nachrichtenportale im Internet. Dieses können wir mit unternehmensspezifischem Wissen anreichern, etwa aus Produktkatalogen oder dem Schriftverkehr mit Kunden“, erläutert Hoffart. Über komplexe Rechenverfahren werden die Texte dann genauer durchleuchtet und mit Hilfe von linguistischen Werkzeugen analysiert. „Wir können dann Firmen und Branchen einzelnen Kategorien zuordnen und zum Beispiel untersuchen, wie sich die eigene Produkte im Vergleich mit den Angeboten der Konkurrenz im Markt positionieren konnten“, sagt Hoffart. Die Herausforderung sei dabei, dass die Namen von Unternehmen oder Produkten meist nicht nur einmal auf der Welt vergeben werden, sondern in verschiedenen Bedeutungen und in vielfältigen Zusammenhängen erscheinen.

„Unsere Technologie hilft dabei, automatisiert die richtigen Bezüge herzustellen“, erklärt der Informatiker. Der Name Paris steht zum Beispiel nicht nur für die Stadt des Lichts und die Hauptstadt Frankreichs, sondern bezieht sich auch auf die griechische Mythologie und ein prominentes Partygirl mit deutschen Vorfahren, das millionenfach im Internet auftaucht. „Nur wenn es gelingt, diese verschiedenen Bedeutungen eines Namens oder eines Sachverhalts richtig zuzuordnen, kann man riesige Textbestände sinnvoll durchsuchen“, so Hoffart. Die von seinem Team entwickelte intelligente Suchmaschine lernt dabei laufend dazu und ordnet automatisch neue Textinhalte den passenden Kategorien zu. „Die Rechenverfahren sind daher auch für Firmen interessant, die Onlinemedien und soziale Netzwerke auswerten, um etwa den Bekanntheitsgrad eines Produktes oder den Erfolg einer Marketingkampagne zu messen“, nennt Hoffart als weiteres Beispiel.

Das Spin-Off-Unternehmen Ambiverse wird auf der Computermesse Cebit außerdem einen intelligenten Editor vorstellen, der Autoren bei der Recherche und dem Schreiben von Texten unterstützt. Wer dort die Eingabemaske mit neuem Text füttert, bekommt zum Beispiel Hintergrundinformationen aus firmeninternen Leitfäden oder auch aus Internetquellen zur Verfügung gestellt. „Im Text werden zudem wichtige Begriffe automatisch verlinkt und weitere Recherchemöglichkeiten eingeblendet“, so der Informatiker.

Am saarländischen Forschungsstand auf der Cebit (Halle 6, Stand D 28) werden Besucher die Möglichkeit haben, in einem Frage-und-Antwort-Spiel gegen die Künstliche Intelligenz von Ambiverse anzutreten. Ambiverse wird durch das Programm EXIST-Forschungstransfer des Bundesministeriums für Wirtschaft und Energie unterstützt.

Press contact

Dr. Johannes Hoffart
Ambiverse GmbH
Campus E1 4
66123 Saarbrücken
Germany

+49 681 3720 309-0

johannes@ambiverse.com
www.ambiverse.com

Screenshots


Searching for the word “Prada” is imprecise due to its ambiguity

Searching for the word “Prada” is imprecise due to its ambiguity


Searching for the company Prada gives precise results: Ambiguities have been resolved.

Searching for the company Prada gives precise results: Ambiguities have been resolved.


Searching for the category high fashion brands finds documents on all fashion labels.

Searching for the category high fashion brands finds documents on all fashion labels.


Ambiverse Analyze plots the trends of Prada against all other fashion labels.

Ambiverse Analyze plots the trends of Prada against all other fashion labels.


Ambiverse Write allows authors to write texts and link entities at the same time.

Ambiverse Write allows authors to write texts and link entities at the same
time.

G20-WorldMap

World Map of the G20 countries and the top officer category for each country.