How not to review scientific papers

March 5th, 2010 No comments

This year a scientific conference will take place, where me and a number other colleagues of our department submitted papers to. A double-blind review process was selected for this conference, meaning that two independent reviewers will evaluate and give marks for papers. This is (in theory) a good process. Often times the reviews are helpful for the authors, even when their papers are not accepted, and the overall quality of the conference is somewhat ensured. Now, I got back some of the some worst reviews I ever read – not because my papers got rejected (one got accepted) – but because of the review comments. Some colleagues asked me whether to take such reviews seriously and I asked some of them myself. I’d like to share my thoughts about this with you and I’m pretty sure you will agree.

I was (co-)author of two different papers. Since I knew there were a high number of submission, acceptance was not guaranteed, but I was eager to see the reviews, which often proved very helpful on other conferences. These were the actual reviews we got:

Clearly exceeds 400-word limt for abstract.
Very interesting innovative approach on participatory planning software. Once
up and running, I would like to learn more about experiences with the
implementation. (5/10)

At least this review had one hint, that the reviewer actually read the paper. But clearly exceeds 400-word limit? Our abstract had (including date and title) 394 words → FAIL

may be rejected (4/10)

may be rejected? Oh really? That’s so helpful, who needs reasons anyway? My grandmother probably could have written a better review, and she surely isn’t able to read English scientific papers → FAIL

Now to the second paper, which was actually accepted:

In order to properly compare companies as a whole on a higher level, the
authors suggest to a) aggregate key performance indicators towards a single
evaluation value and b) to assign different weights to indicators based on
stakeholder input.
The new models need to be summarized more clearly. (9/10)

Ok, this is actually the best review (which is quite sad), because it shows the reviewer at least read it. Also, he/she gives one hint, which is not really helpful (in a full paper it’s much easier to clearly present the approach compared to a 400-word abstract), but at least it’s something. In other conferences this review would be fail, but now my standards are so low already, I’ll say it’s acceptable. Not to worry though, there’s another review:

good paper (8/10)

Gee, thanks! This is such a reasonable, well structured review. What can I say? Oh yes → FAIL

One of the foundations of scientific method is to have results written down in an understandable (reproducible) order. This conference had more submission than expected, granted. But having this review process is just utterly pointless – you can’t even tell if the reviewers at least had a look at your paper. For what it’s worth: Most of the papers accepted here had some professor titles as authors – this doesn’t necessarily mean anything, but just a hint on another big problem of current science – titles are more important than content.
Overall, this feedback just leaves a very shallow taste whether the conference (or at least the reviewers) can be taken seriously. The conference hasn’t even started and already leaves an unprofessional impression. Let’s hope, the actual presentations and final papers will make up for this.

How to create a law that no one wants

February 25th, 2010 No comments

A prime example on how much many of our politicians and parties suck, has just come into effect; not only does it show that in times of election laws are constructed just for the cause of doing something (which in the best cases is harmless and plain nonsense), but also demonstrates the utter incompetence of politicians:
The Zugangserschwerungsgesetz (“Bill on making access more difficult”, rough translation, isn’t the German language just great?) has passed, although pretty much everyone else was against it.

Well, now elections are over and suddenly even the Verräterpartei (traitor’s party) and the Schwarze Pest (black plaque) are against their own law! To top it all, they are now advising the police not to apply the new law, which again is unconstitutional.

And those two form our biggest parties! German major parties – where incompetency and symbol politics meet in perfect harmony.
(not that this does not apply to other parties, too)

Moonlight Sonata

October 16th, 2009 No comments

To be honest, I find most classical music to be plain boring. But a number of compositions stand out, being absolutely brilliant and I love listening to them. One of them being the Moonlight Sonata from Beethoven. I heard some people saying that music is similar to mathematics; well I never could really see why. In this video, the music is visualised in a way I’ve not seen before and while I still not necessarily see a connection to Math, it certainly has a beautiful structure to it, besides the music itself. Just watch it:

Plain beautiful.

Gerade vom Opt-Out-Day zurück

September 17th, 2009 No comments

und muss sagen, es waren deutlich mehr da, als erwartet. Ehrlich gesagt hatte ich mit deutlich weniger als zehn Leuten gerechnet, aber bei der von uns durchgeführten amtlichen Endzählung waren es dann doch 24. Da einige mehrere Widerspruchserklärungen mitgebracht hatten, gab’s dann doch eine ganz hübsche Anzahl. Und darüber hinaus gab’s vor dem Bürgerbüro zufällig noch ein schönes Aufgebot an Militär, passend zur Aktion (“Bundeswehreinsatz im Inneren”, wie einer meinte 😉 ).  Insgesamt war der Männeranteil zwar deutlich >90% (nur eine Frau glaube ich) und die üblichen Verdächtigen da – ich habe einige Kollegen und ehemalige Kommilitonen erkannt – aber der Opt-Out-Day in Oldenburg war ein Erfolg, finde ich.

Anbei noch ein paar Bilder, da ich das eine leider sehr verwackelt habe, spar ich mir da die Arbeit mit Gesichter unkenntlich machen.

Opt-out Day – Oldenburg

August 17th, 2009 2 comments

Dass die Meldeämter ungefragt Adressdaten z.B. an die GEZ weitergeben, war mir ja bekannt. Dass die noch mehr weitergeben dürfen und dass dagegen ein Widerspruchrecht besteht, hingegen nicht. Die Piratenpartei hat nun für den 17. September den Opt-Out-Day ausgerufen. Heißt im Klartext:

Geht zu eurer lokalen Meldebehörde und widersprecht der Weitergabe eurer persönlichen Daten. Für Oldenburg finden sich die entsprechenden Formulare hier. Das zweite Dokument sollte m.E. ausreichen. Der Zeitpunkt des gemeinsamen Treffens wird noch bekannt gegeben, weitere Infos für Oldenburg hier.

Was mir aber nicht ganz klar ist: Widerspreche ich damit tatsächlich auch der Weitergabe meiner Daten an die GEZ-Mafia? Schriftliche Auskünfte sind explizit nicht verboten, heisst das, das es im Prinzip nur aufwendiger wird? Aber wäre ja immerhin auch schon etwas.

Update: Da durch RSS-Aggregator (z.B. gReader) ja Kommentare gerne untergehen – GEZ-Auskünfte kann man damit wohl nicht umgehen. Trotzdem ‘ne gute Sache.

Die Verräter-Partei

July 1st, 2009 2 comments

Na das ist doch mal ne schöne Google-Bombe: Geht mal auf und gebt “verräter partei” ein. Erstes Sucherergebnis? Muaha

Achja, um mich in diesem Beitrag auch konstruktiv zu beteiligen 😉 Verräter Partei

Solving Sound Problems with Dosbox in Ubuntu 8.10 and 9.04

June 27th, 2009 No comments

Hey guys, since I get a lot of hits to this article, I’d really appreciate if you leave a short note when this helped you, so we can see if this is a general configuration problem. Thanks!

Since ubuntu 8.10 I was having stuttering sound with dosbox. I just made a fresh install of 9.04 and still was experiencing such problems (pulseaudio ftw again…). I searched the web, alas was unable to find a solution that was actually working. After trying a couple of things, I finally seem to have found a solution which is working (at least for me): I set the mixing rate within dosbox to match that of pulseaudio. To make it short, change your conf in ~/.dosbox/ to

#   nosound: Enable silent mode, sound is still emulated though.
#      rate: Mixer sample rate, setting any device's rate higher than this will probably lower their sound quality.
#            Possible values: 22050, 44100, 48000, 32000, 16000, 11025, 8000, 49716.
# blocksize: Mixer block size, larger blocks might help sound stuttering but sound will also be more lagged.
#            Possible values: 2048, 4096, 8192, 1024, 512, 256.
# prebuffer: How many milliseconds of data to keep on top of the blocksize.
rate=44100      # Change this line

Also, to get rid of the initial midi warning I changed the following, though it may not be necessary:

#     mpu401: Type of MPU-401 to emulate.
#             Possible values: intelligent, uart, none.
# mididevice: Device that will receive the MIDI data from MPU-401.
#             Possible values: default, win32, alsa, oss, coreaudio, coremidi, none.
# midiconfig: Special configuration options for the device driver. This is usually the id of the device you want to use. See README for details.
midiconfig=128:0      # Change this line

Yet another pulseaudio problem solved.

Update: Also, setting output to opengl helps a lot, at least if you have compiz enabled.

“Das NBL beruht auf der Gleichverteilung der Mantissen der Logarithmen der Zahlenwerte des Datensatzes”

June 18th, 2009 No comments

Heise hat gestern einen Artikel veröffentlicht, in dem von Wahlfälschungen bei der Iranischen Wahl die Rede ist (gefällt mir; andere sprechen immer schön euphemistisch von “Unregelmäßigkeiten”). Diese werden begründet durch statistische Analysen mittels des Newcomb-Benford’s Law (NBL). Dieses Gesetz finde ich hochinteressant, ist allerdings länger her, dass ich mir das angeschaut hatte. Was ist zu tun in diesem Fall? -> ganz klar, Wikipedia aufrufen. Entgegen meiner Gewohnheit habe ich die deutsche Wikipedia genutzt. Folgendermaßen wird das NBL erklärt:

Das NBL besagt, dass die Auftretenswahrscheinlichkeiten der Ziffernsequenzen in den Zahlen von realen Datensätzen (damit sind hier solche gemeint, die keinen Manipulationen unterlagen) genügend umfangreich sind und Zahlen in der Größenordnung von x bis mindestens 10000 x aufweisen. Daten also, welche einigermaßen weit verteilt (dispergiert sind), nicht gleichverteilt sind, sondern logarithmischen Gesetzen folgen. Das bedeutet, dass die Auftretenswahrscheinlichkeit einer Ziffernsequenz umso höher ist, je kleiner sie wertmäßig ist und je weiter links sie in der Zahl beginnt. Am häufigsten ist die Anfangssequenz ‚1‘ mit theoretisch 30,103 %. Das NBL beruht auf der Gleichverteilung der Mantissen der Logarithmen der Zahlenwerte des Datensatzes. Der Grund für das erstaunlich häufige Gelten des NBL liegt an dem Umstand, dass viele reale Datensätze log-normalverteilt sind, nicht also die Häufigkeiten der Daten selbst, sondern die Häufigkeiten der Logarithmen dieser Daten einer Normalverteilung folgen. Bei genügend breiter Dispersion der normalverteilten Logarithmen (wenn die Standardabweichung größer/gleich etwa 0.74 ist) kommt es dazu, dass die Mantissen der Logarithmen stabil einer Gleichverteilung folgen. Ist die Standardabweichung allerdings kleiner, sind auch die Mantissen normalverteilt, und das NBL gilt nicht mehr, zumindest nicht mehr in der dargestellten einfachen Form. Ist die Standardabweichung kleiner als 0.74, kommt es zu dem in der Statistik nicht allzu häufigen Effekt, dass sogar der jeweilige Mittelwert der Normalverteilung der Logarithmen die Auftretenshäufigkeit der Ziffernsequenzen beeinflusst. Geht man einerseits vom NBL in der heutigen Form aus, so existieren zahlreiche Datensätze, die dem NBL nicht genügen. Andererseits gibt es bereits eine Formulierung des NBL in der Form, dass ihm sämtliche Datensätze genügen. Die Formulierung des „allgemeinen NBL“ ist wesentlich komplexer und enthält die bekannte Form des NBL als Grenzverteilung. Ihre Darstellung würde den Rahmen dieser Seite sprengen.

Das Benfordsche Gesetz gilt insbesondere für Zahlenmaterial, das natürlichen Wachstumsprozessen unterliegt. Dann nämlich verändern sich die Zahlen im Laufe der Zeit und verzehnfachen sich. Die erste Position der Mantisse verharrt für ca. 30% der Zeit auf der 1, 18% der Zeit auf der 2 usw: Das entspricht der logarithmischen Verteilung, die das benfordsche Gesetz vorhersagt und ist unabhängig von der Zeit in der eine Verzehnfachung erfolgt. Dann beginnt der Zyklus von Neuem bei der 1. Bei einer Momentaufnahme der Preise eines Supermaktes, wird man genau diese Verteilung finden, egal wann die Erhebung durchgeführt wird.

Quelle: (Autoren und Lizenz auf der Seite)

WTF?! Ich möchte mal wissen, wer das kapieren soll, der das Gesetz nicht schon kennt oder Mathematik studiert. Nun ist die englische Wikipedia in diesem Fall auch nicht viel einfacher zu verstehen, aber folgender Absatz war doch hilfreich:

A simple example may help clarify how this works. To say that a quantity is “growing exponentially” is just another way of saying that its doubling time is constant. If the quantity takes a year to double, then after one more year, it has doubled again. Thus it will be four times its original value at the end of the second year, eight times its original value at the end of the third year, and so on. Suppose we start the timer when a quantity that is doubling every year has reached the value of 100. Its value will have a leading digit of 1 for the entire first year. During the second year, its value will have a leading digit of 2 for a little over seven months, and 3 for the remaining five. During the third year, the leading digit will pass through 4, 5, 6, and 7, spending less and less time with each succeeding digit. Fairly early in the fourth year, the leading digits will pass through 8 and 9. Then the quantity’s value will have reached 1000, and the process starts again. From this example, it’s easy to see that if you sampled the quantity’s value at random times throughout those years, you’re more likely to have measured it when the value of its leading digit was 1, and successively less likely to have measured it when the value was moving through increasingly higher leading digits.

This example makes it plausible that data tables that involve measurements of exponentially growing quantities will agree with Benford’s Law. But the Law also appears to hold for many cases where an exponential growth pattern is not obvious.
Quelle: (Autoren und Lizenzen auf der Webseite)

Im Prinzip geht es also darum, dass bei konstanter Verdopplungszeit der Sprung von 1 auf 2 genauso lange braucht wie von 2 nach 4, so dass etwa die 3 kürzer bzw. seltener aufzutreffen ist als die 1,5 (weil im ersten Fall in der gleichen Zeit nur halb so viele Werte zu durchlaufen sind wie von 2 nach 4 oder ein Viertel von 4 bis 8). Geht doch. Die “Gleichverteilung der Mantissen der Logarithmen der Zahlenwerte des Datensatzes” geht mir in diesem Fall sonstwo vorbei. Dieser Satz taugt zwar zur Erheiterung, aber nicht zur Erklärung.

Deutsch ist meine Muttersprache. Auch wenn mein Englisch sicherlich verhältnismäßig gut ist, so wird es bei vielen Sachen vermutlich immer einfacher sein, mich in Deutsch auszudrücken. Dennoch ist es so, dass ich Computerrelevantes seit langem fast ausschließlich in Englisch mache. Ein paar weitere Beispiele:

  • Mein Betriebssystem (Ubuntu) ist auf Englisch eingestellt. Der Grund ist einfach: Wie mit jeder großen Software gibt es Probleme, die gelöst werden müssen. Die deutsche Community um Ubuntu ist recht groß, aber das offizielle Forum und vor allem Bug-Reports sind auf englisch. Um ein Problem zu beheben kommt man deswegen mit den englischen Originalbegriffen deutlich schneller ans Ziel. Davon abgesehen finde ich die englischen Bezeichnungen oft eingängiger.
  • In Google suche ich mittlerweile nur noch auf Englisch; hier ist der Wechsel anfangs sicherlich schwieriger, weil man sich halbwegs sicher mit den passenden Begriffen sein muss. Wenn man aber erstmal so weit ist, dass die Suchbegriffe ähnlich gut wie im Deutschen sind, kommt schon alleine ein quantitativer Sprung hinzu: Es gibt einfach wesentlich mehr im Englischen zu finden als im Deutschen.

Letzter Punkt ist im Prinzip wesentlich dafür, dass Recherchen im Internet i.d.R. im Englischen bessere Ergebnisse erbringen; viele Menschen schreiben und unterhalten sich in ihrer Muttersprache und in Englisch (s. diese Blog), so dass Englisch, auch als internationale Sprache, wesentlich stärker vertreten ist als eine einzelne andere Sprache. Die Qualität des Geschriebenen ist dadurch im Schnitt nicht besser als in Sprachen, in denen weniger veröffentlicht wird (s. wieder dieses Blog 😉 ), aber ein anderer Effekt tritt auf: Suchmaschinen wie Google mit ihrem PageRank-Algorithmus sind mittlerweile einigermaßen gut dazu in der Lage, die besten Suchergebnisse zu finden und entsprechend zu platzieren, so dass die ebenfalls große Menge schlechter Suchergebnisse nicht dargestellt wird.

Durch diesen Ansatz wirkt sich letztlich Quantität auch positiv auf die Qualität aus, da schlechte Beiträge in den Nirwanas der Suchmaschinenfilter verschwinden. Ein weiterer Grund, die englische Grundbildung in unserer Gesellschaft wesentlich stärker zu betonen, als es momentan der Fall ist.

(gefällt mir; andere sprechen immer schön euphemistisch von “Unregelmäßigkeiten”)

My Firefox Add-ons

May 19th, 2009 8 comments

One thing I like very much about firefox is its extensibility. I like to read about add-on recommendations to find new, good add-ons, so why not write about the ones I use myself. Maybe you’ll find something new:

  • Adblock Plus
    An ad blocker is imho one of the most important features any browser should offer. When using someone’s browser without any sort of ad blocking, internet is just pure horror.
  • BugMeNot
    Pretty useful when encountering one of those “only registered users can view this, though you don’t have to pay and we just want to annoy the heck out of you” web sites. BugMeNot stores passwords for several free-login web sites.
  • CS Lite
    Probably not important for >95% of the users out there, but I like to keep my system clean and don’t want to have unwanted cookies permanently. This add-on removes all cookies when exiting the browser (except for pages that have been whitelisted)
  • Download Statusbar
    Displays all downloads in a small bar at the bottom, instead of opening the download window.
  • Firebug
    Seems to be very useful for debugging web sites, can display serves states etc. I never really used it myself, but looks promising.
  • FireGestures
    Integrates mouse gestures, like formerly introduced in Opera.
  • GooglePreview
    Adds a preview page to every google search result. Same functionality available also with greasemonkey afaik.
  • Html Validator
    Displays a small icon at the lower right to check whether a page is valid html.
  • NoScript
    I liked this, because it removed all those pesky JavaScript and flash ads, as well as some other JavaScript annoyances. But since it’s not so necessary and the developers tampered with ad block, I cannot truly recommend this one any more.
  • Locationbar²
    Highlights the current domain in the address bar and enables fast browsing through different levels of the url by pressing ctrl and clicking on the part of the path you want to go to.
  • Tiny Menu
    I like my browser neat and clean, and this one helps a lot. This way, I could put menu, buttons, address, and search in one bar at the top, have one bar for the bookmarks and the rest for browsing. The more view space for web pages, the better.
  • Zemanta
    I haven’t made up my mind about this one yet, but it shows potential for enriching word press articles.

If you think I’m missing a good add-on, please let me know.

Was Schäuble und Zensursula wirklich wollen

May 19th, 2009 No comments
Dieser Eintrag ist in Ihrem Land nicht verfügbar.

via It-Guerilla

(Ok, normalerweise beteilige ich mich nicht an solchen Aktionen, aber das fand ich ganz pfiffig)

