Archiv der Kategorie: Computerlinguistik

Wrong Independence Assumptions

When you build probabilistic models of something (say natural language grammars), you always fall prey, to some degree or other, to wrong independence assumptions. For example, a model might capture the fact that two events are each very probable to … Weiterlesen

Veröffentlicht unter Computerlinguistik, Medien | 1 Kommentar

E(νέργεια|nerg(i(a|e)|y)))

Wie geil ist denn bitte diese multilinguale Darstellung des Wortes Energie auf der Verpackung einer Philips-Energiesparlampe? Man müsste nur ein paar Kreise und Pfeile hinzufügen und hätte eine Darstellung des entsprechenden endlichen Automaten.

Veröffentlicht unter Computerlinguistik, Sprache, Welt | 2 Kommentare

Plagiatsapologie ohne Sinn und Bedeutung

Selten las ich solchen Schwachsinn wie die „sprachphilosophische Spurensuche“ zu Plagiatsvorwürfen, die Rafael Wawer gestern in das Redaktionssystem von Zeit Online gerotzt hat: [A]ngenommen, Google oder Stephan Wolfram [sic] brächten demnächst eine öffentliche Plagiatssuchmaschine heraus, die das heutige Internet als … Weiterlesen

Veröffentlicht unter Computerlinguistik, Geistesleben, Sprache, Zeitwatch | 15 Kommentare

TIGERSearch-Rätsel

Nach dem seligen Zyklenfinder noch eine kleine Knobelaufgabe zur Entspannung für TIGERSearch-Freaks und -Veteranen: Was macht dieses Muster? Bonusfrage: Wozu dient die kleine Asymmetrie?

Veröffentlicht unter Computerlinguistik | Hinterlasse einen Kommentar

Zwischen Kontextfreiheit und Kontextsensitivität, Teil 3: Nicht kontextfreie Grammatiken für Fragmente natürlicher Sprachen

Kontextfreie Grammatiken sind sehr beliebt für die Beschreibung natürlicher Sprachen. Zumindest in der Theorie und solange es nicht zu kompliziert wird, eignen sie sich gut dafür, Syntax in den Griff zu kriegen. Warum interessieren sich manche Computerlinguistien dann so für … Weiterlesen

Veröffentlicht unter Computerlinguistik | 3 Kommentare

Zwischen Kontextfreiheit und Kontextsensitivität, Teil 2: Eine erweiterte Chomsky-Hierarchie

Ausgelöst durch Prüfungsvorbereitung und Schreiben an der Masterarbeit habe ich mich in letzter Zeit viel mit Typen formaler Grammatiken beschäftigt, die alle kontextfreien Sprachen beschreiben können und darüber hinaus einige, aber nicht alle kontextsensitiven Sprachen. Einen solchen Grammatikformalismus, nämlich Simple … Weiterlesen

Veröffentlicht unter Computerlinguistik | 6 Kommentare

Zwischen Kontextfreiheit und Kontextsensitivität, Teil 1: Crashkurs Simple Range Concatenation Grammars (SRCG)

In Herrn Raus Blog gibt es eine schöne mehrteilige Einführung in formale Sprachen, formale Grammatiken und die Chomksy-Hierarchie. Unter anderem werden dort reguläre Grammatiken, kontextfreie Grammatiken und kontextsensitive Grammatiken vorgestellt. Ich will heute einen weniger bekannten Grammatikformalismus vorstellen: Simple Range … Weiterlesen

Veröffentlicht unter Computerlinguistik | 4 Kommentare

diff für Juristen

$ diff -j ThüFischG-20060628.txt ThüFischG-20080630.txt | head -n 7 1. § 4 wird wie folgt geändert: a) In Absatz 1 werden das Wort “, Wasserbuch,” durch das Wort “oder” ersetzt und die Worte “oder Fischereikataster” gestrichen. b) Absatz 2 Satz … Weiterlesen

Veröffentlicht unter Computerlinguistik, Technik, Welt | Hinterlasse einen Kommentar

So schlicht, so schön, so nützlich

Veröffentlicht unter Computerlinguistik | 5 Kommentare

Tag stripper/text ripper

Mir ist gerade aufgefallen, dass diese beiden Wörter fast gleich klingen und im richtigen Kontext auch fast dasselbe bedeuten.

Veröffentlicht unter Computerlinguistik, Geistesleben, Sprache | Hinterlasse einen Kommentar