Counting unofficial retweets
One way of finding out who’s influential on Twitter is to count how often people are retweeted. I did so when analysing the Twitter discussion on the election of the new president of the Dutch trade union confederation FNV.
I counted both ‘official’ retweets – retweets acknowledged by Twitter – and ‘unofficial’ retweets. Unofficial retweets may have been generated by unofficial Twitter apps (I think) or users may have typed them manually. They may have the pattern RT@username:text (which is also the pattern of official retweets), the pattern "@username:text", or the pattern text via @username (this pattern wasn’t in my original analysis). Perhaps there are more flavours around that I don’t know of.
When looking for background information, I came across a comment by an SEO analyst explaining why they don’t count unofficial retweets:
To try to count non-official RTs is a messy business, as it would require a lot more Twitter API calls for possibly negligible benefit. Why negligible? We make an assumption that non-official RTs correlate strongly with official RTs. We can then use the latter as a proxy for the former. This assumption may not be true, of course. That is, by not using non-official RTs, we may ignore pockets of users who generate many more unofficial RTs... perhaps those who ask a question, or invite a response? (comment by Pete Bray on this article)
Below is some information on how often users in my FNV sample were retweeted within that same sample.
| Official retweet | RT@username:text | "@username:text" | text via @username | |
|---|---|---|---|---|
| Sum | 3,544 | 113 | 98 | 60 |
At least within this sample, unofficial retweets are not very common: they make up about seven percent of all retweets. And here’s some information on how official and unofficial retweets are correlated:
| Official retweet | RT@username:text | "@username:text" | text via @username | |
|---|---|---|---|---|
| Official retweet | 1 | 0.28 | 0.25 | 0.13 |
| RT@username:text | 0.28 | 1 | 0.14 | 0.10 |
| "@username:text" | 0.25 | 0.14 | 1 | 0.13 |
| text via @username | 0.13 | 0.10 | 0.13 | 1 |
Users who generate more official retweets also tend to generate more unofficial retweets, but the correlation is not particularly strong. So based on this sample, it would seem conceivable that there are indeed ‘pockets of users who generate many more unofficial RTs’ – as suggested by Bray.
Method
The sample contains close to 11,000 tweets containing the string FNV, collected between 26 April and 16 May. For background see this article; the analysis of retweets in the FNV debate is here. The code I used for the analysis above is here.
If you have a sample of tweets and you want to know how often users in that sample have been retweeted, you can only find that out for retweets that are also in the same sample. In my case that wasn’t a problem, for I was interested in who was influential within a specific discussion. However, if you’d be interested in constructing a general measure of how influential twitter users are, you’d probably need a pretty large sample of tweets.
The messiest type of retweet is probably text via @username. Often these aren’t real retweets but added by services like sharethis or AddThis or by news websites that have their own share service (I only included users if they were already in the sample, i.e. had tweeted texts containing FNV; this eliminates sharethis and AddThis tweets). I looked for the pattern via @ followed by any number of non-whitespace characters at the end of the line, or followed by any number of non-whitespace characters before the first whitespace. This method may not be 100% accurate, but I think it’ll do. The regex patterns used to find the different types of retweets are in the code.
Because the retweet counts are not normally distributed (many have a value of 0) I used spearman rank correlation; pearson’s correlation would have yielded stronger - but still not particularly strong - correlations of up to 0.5.
Hoofdrolspelers in de Twitterdiscussie over de FNV-voorzitter
Nederlands - Ik heb de hoofdrolspelers in de twitterdiscussie over de verkiezing van de nieuwe FNV-voorzitter in beeld gebracht. Omdat de grafiek niet in deze kolom past, heb ik er een aparte pagina voor gemaakt. Werkt het best met Chrome.
English - I’ve visualised the key players in the debate on Twitter on the election of the new president of the Dutch trade union confederation FNV. Since it doesn’t fit in this column, I’ve created a separate page. Best viewed in Chrome.
Fietsstad Utrecht
Onlangs is Utrecht uitgeroepen tot mondiale fietsstad nummer 3. Toen ik bijna drie jaar geleden in Utrecht ging werken vond ik de stad helemaal niet fietsvriendelijk - integendeel. De omgeving van het station is een chaos als gevolg van de eindeloze herinrichting. Fietsers worden door te smalle omleidingen geleid, die ook nog eens van de ene dag op de andere van route kunnen veranderen. M’n favoriete fietsenstalling, recht onder het station, is naar het Smakkelaarsveld verbannen (1).
Ook los van de vernieuwing van het stationsgebied is er genoeg om je aan te ergeren. Zoals de lange wachttijd voor de stoplichten bij de Maliebaan en de Maliesingel (2). De rare hoek in het fietspad bij het Janskerkhof (3). Het feit dat je in de binnenstad onverwacht op straten stuit waar je niet mag fietsen. En het rare stoplicht bij Rijnsweerd (4).
Inmiddels ben ik gewend geraakt aan de stad. De chaos rond het station voelt normaal aan. Ik ontdekte al vrij snel de scenic routes waar je op uitkomt via de monumentale strook park langs de Catharijnesingel (5) – routes waar je lekker door kan fietsen. En ik heb de indruk dat de lokale Fietsersbond goed bezig is met het aanpakken van excessieve wachttijden en andere ongemakken. Ik had er nog niet zo bij stilgestaan, maar ik heb me verzoend met fietsstad Utrecht.
Appnet – better than Twitter?
About a year ago, someone suggested Twitter should charge its users $1 per month:
What if somehow the $1 per month could ensure a certain quality of service, additional features, and a minimum of invasive ads? It might work. Users would be happier, and the company would be more profitable and able to invest in its products. Having transparency – knowing that the $1 per month wasn't wasted on excessive bonuses, private jets, and sushi flown in from Japan – would be essential.
App.net, a service launched in July, seems to be doing just that. OK, its paid version costs a bit more than $1 per month. On the other hand, it doesn’t have ‘a minimum of invasive ads’, but simply no ads. Further, it’s not just a Twitter clone. Basically, it’s a place where you store your photos, documents and other content and choose which applications can interact with them – instead of letting services like Twitter or Facebook control your data.
I like the idea. There’s just one minor problem: nobody I know seems to be on App.net. On the other hand, if we all wait for other people to join first, nothing will happen. So I’ve created an account. Let’s see what happens.
It should be possible to try out App.net for free (with a few limitations). I used an invite from Lifehacker which isn’t valid anymore, but it probably shouldn’t be too difficult to find people offering free invites. For example, this link still seems to work.
Wie wordt volgens Twitter de nieuwe FNV-voorzitter
Aantal tweets waarin kandidaten worden genoemd
Volgens Amerikaans onderzoek kan je de uitkomst van verkiezingen voorspellen door simpelweg te tellen hoe vaak de namen van de kandidaten worden genoemd op Twitter. Zou je op deze manier ook kunnen voorspellen wie de nieuwe voorzitter wordt van de FNV?
Ik heb vanaf afgelopen vrijdag de tweets verzameld waarin de term ‘FNV’ voorkomt, tot nog toe zijn dat er ruim 2.500. In deze tweets wordt Ton Heerts 204 keer genoemd en Corrie van Brenk 146 keer (tweets waarin ze allebei worden genoemd laat ik buiten beschouwing). Kortom, als Twitter een goede graadmeter is (daarover valt natuurlijk te discussiëren) dan wordt de strijd spannender dan het aanvankelijk misschien leek.
De grafiek hierboven laat de resultaten zien voor de dagen waarvoor volledige gegevens beschikbaar zijn. Er was vanaf zaterdag aandacht voor Van Brenk (vanwege deze factcheck). Op zondag werd Heerts genoemd omdat hij te gast was in het tv-programma van Eva Jinek. Op 1 mei werden de kandidaten officieel bekendgemaakt en gingen ze met elkaar in debat.
Update - Bijgewerkt tot en met 13 mei, de laatste dag waarop gestemd kon worden. In totaal is Van Brenk 497 keer genoemd en Heerts 631. Inmiddels is bekend dat Heerts de verkiezing heeft gewonnen (uiteraard is daarmee nog niet gezegd dat de methode hout snijdt: om daar iets zinnigs over te kunnen zeggen zou je een flink aantal voorspellingen moeten kunnen beoordelen).
In de grafiek zijn onder meer de volgende invloeden zichtbaar: Factcheck bevestigt uitspraak Van Brenk (vanaf 27 april); Heerts bij Eva Jinek (28 april); officiële bekendmaking kandidaten (1 mei); debat bij Buitenhof (5 mei); belastingaffaire waarover Van Brenk’s Abvakabo FNV al aan de bel had getrokken (6 mei); interview Van Brenk op Nu.nl (9 mei); radio-optreden Van Brenk (10 mei); Heerts bij presentatie Techniekpact (13 mei); peiling EenVandaag voorspelt dat Heerts wint (13 mei).
De grafiek is mogelijk niet zichtbaar in oude versies van Internet Explorer.
Methode
Tweets heb ik verzameld via de Twitter Streaming API (de ‘brandslang’), op de manier die hier wordt beschreven. Daarbij heb ik gefilterd op de zoekterm ‘fnv’. Ik heb de gegevens met Python bewerkt en met R geanalyseerd (de code staat op Github). De grafiek is gemaakt met D3.js.
Ik heb nog gekeken naar hoe invloedrijk de twitteraars zijn (hoeveel volgers; hoe vaak opgenomen in lijsten) en naar hun achtergrond (noemen ze in hun profiel bijvoorbeeld de FNV). Het belangrijkste wat dit opleverde is dat twitteraars die Van Brenk noemen vaker ‘abva’ of ‘akf’ in hun profiel noemen - niet verassend aangezien Van Brenk momenteel voorzitter is van Abvakabo FNV.
Het Amerikaanse onderzoek naar Twitter als voorspeller van verkiezingsuitslagen is uitgevoerd door DiGrazia en anderen en is hier te vinden. Enkele opmerkingen over hun onderzoek:
- Het klopt natuurlijk dat twitteraars maar een klein deel van de bevolking vormen en dat ze niet representatief zijn voor de hele bevolking. Waarschijnlijk wordt het beeld op Twitter vooral bepaald door een kleine, actieve incrowd. Ook klopt het dat een tweet waarin een kandidaat wordt genoemd niet altijd positief is; soms wordt er juist kritiek geuit. Ondanks dit alles bleek uit het onderzoek van DiGrazia e.a. dat het aantal keer dat een kandidaat op Twitter wordt genoemd een consistente voorspeller vormt van verkiezingsuitslagen. Wellicht vormt het aantal vermeldingen op twitter een indicator voor iets anders, bijvoorbeeld media-aandacht of hoe actief er campagne wordt gevoerd voor een kandidaat.
- De methode biedt uiteraard geen zekerheid over wie er wint. Het kan voorkomen dat een kandidaat bijna 100% van de twittervermeldingen krijgt en toch verliest (althans dat suggereren de scatterplots die DiGrazia e.a. laten zien).
- Het is onduidelijk in hoeverre de conclusies van het Amerikaanse onderzoek naar andere situaties kunnen worden gegeneraliseerd. Het is daarom wel een beetje een gok om met deze methode te voorspellen wie de nieuwe voorzitter van de FNV wordt.
Can Twitter predict the new Dutch trade union president
Number of tweets in which candidates are mentioned
According to an American study, you can predict the outcome of elections by simply counting how often the names of the candidates are mentioned on Twitter. Members of the Dutch union confederation FNV are currently voting for their new president (it has been claimed this is the first time in the world union members get to directly elect their confederation president). Would it be possible to predict who will be the new FNV president using Twitter?
Since last Friday, I’ve been collecting the tweets containing the term ‘FNV’; so far, there are over 2,500. In those tweets, the incumbent Ton Heerts is mentioned 204 times, whereas his challenger Corrie van Brenk is mentioned 146 times. In short, if Twitter is a good predictor (which of course is a matter for debate), the contest is tighter than one might have expected.
The graph above shows the results for the days for which complete data is available. On Saturday, Van Brenk got some attention because something she had said had been fact checked (and found to be correct). On Sunday, Heerts was mentioned because he appeared on a TV show hosted by Eva Jinek. On 1 May, it was officially announced who the candidates are and they had a debate.
Update - Updated to include 13 May, the final voting day. In sum, Van Brenk was mentioned 497 times and Heerts 631. It has since been announced that Heerts has won the election (of course, this doesn’t necessarily mean that the method is sound; in order to make such claims one would need to evaluate a fair amount of predictions).
Influences reflected in the graph include: Factcheck confirms Van Brenk statement (27 April); Heerts in Eva Jinek TV show (28 April); candidates officially announced (1 May); debate in Buitenhof TV show (5 May); problems at tax authorities that Van Brenk’s Abvakabo FNV had warned about (6 May); Van Brenk interview at Nu.nl (9 May); Van Brenk in radio show (10 May); Heerts at presentation of initiative to train technical staff (13 May); EenVandaag TV show poll predicts Heerts will win (13 May).
The graph may not be visible in older versions of Internet Explorer.
Method
I collected tweets using the Twitter Streaming API (the ‘firehose’), in the way described here. I prepared the data using Python and analysed it using R (find the code on Github). The graph was created with D3.js.
I looked into how influential twitterers are (how many followers, how often listed) and into their backgrounds (e.g., do they mention ‘fnv’ in their profile). The most important finding is that twitterers who mention Van Brenk, more often mention ‘abva’ or ‘akf’ in their profile - not surprising since Van Brenk is currently president of Abvakabo FNV, the public sector union affiliated to the FNV.
The American study on Twitter as a predictor of election outcomes was done by DiGrazia c.s. and can be found here. Some remarks on their study:
- Yes, twitterers are only a small part of the population and no, they’re not representative of the entire population. Likely, Twitter is dominated by a small, active incrowd. It’s also correct that tweets mentioning a candidate need not endorse them; they may as well be critical. Despite all this, DiGrazia c.s. found that mentions on Twitter consistently predict election outcomes. Perhaps they are an indicator of something else - e.g. media attention or how actively people are campaigning for a candidate.
- Of course, this method doesn’t provide any certainty on who will win. It’s possible for a candidate to get almost 100% of the tweet share and still lose (at least, that’s what the scatterplots of DiGrazia c.s. suggest).
- It’s unclear to what extent the conclusions of the American study can be generalised to other situations. It’s therefore a bit of a gamble to use this method to predict who will be the next president of the FNV.
Can I get control over my smartphone data
The new Facebook phone will make it easier to collect data:
It’s going to know where you are, who you’re talking to and when, even what apps you’re running. All of which is great for Facebook, because ultimately Facebook wants to know every little thing it can about you so it can get you to click on some ads. (Wired)
Of course, this is not radically different from the way in which smartphones are already being used to collect information about their users. If you don’t want to be tracked, don’t use a smartphone. Also, don’t pay electronically (or supermarkets will know if you’re pregnant) and stay clear from social media.
At least, that used to be sensible advice – but not anymore. Whether you have a smartphone or not: everybody will be tracked.
In a world full of surveillance cameras, cameras on smartphones (and soon on the Google Glass) and drones equiped with cameras, microphones and other sensors that can observe you even in your private home, it’s impossible to escape being observed. Voice, speech and face recognition software will recognize you (for example, in stores). And data companies like Rapleaf will happily buy, merge and analyse such data to create an ever more detailed profile of you.
Even though this only underlines the futility of clinging to privacy, it would still be nice if there were a smartphone that would give you more control over your data.
Two initiatives may offer some hope. New operating systems for smartphones are introduced, including one from Mozilla, the ‘most trusted internet company for privacy’. And a Dutch company, FairPhone, is developing a smartphone ‘designed and produced with minimal harm to people and planet’. I emailed both to ask whether they will give users more control over their data.
I got a response from FairPhone – in fact, they were quite helpful. Don’t expect radical changes: the operating system will still determine what apps run on the phone and what kind of data they will be able to collect (e.g. location, addresses, websites visited) – with or without the user’s consent. In that respect, little changes. Still, FairPhone will give you a bit more control over your phone by allowing you to install an alternative operating system (e.g., Mozilla’s Firefox or, when available, Ubuntu). Also, they consider developing an app that explains to users what happens with their data.
Bicycling Science
A recent article discusses fifteen ways to cycle faster, so as to stay ahead of the e-bikes (via AmsterdamFietst). Some of the information is from a book called Bicycling Science. I had never heard of that book, but apparently it’s a classic which - among many other things - lists ‘some prescriptions for increasing speed at medium- or high-power levels’. These will not come as a big surprise: A combination of tight clothes, good body position and an ‘aerodynamically clean’ bicycle can reduce drag by 50% or more. Through training, a ‘basically fit rider’ can increase power by up to 30%. And of course, cyclists should properly inflate their tires. Reducing bicycle or body weight doesn’t seem to help much, at least not for cycling on a flat surface.
Bicycling Science is a technical book, but occasionally the cycling enthusiast gains the upper hand. For example, in a discussion of slope resistance, this observation pops up:
The author remembers riding up a hill with a maximum slope of 1 in 3.5 (grade of 30%), possibly Porlock Hill in Devon, United Kingdom, on a three-speed heavy bike (i.e., one having a low gear of around 36’’).
Much of the information in the book is too technical for me. Nevertheless, it’s fun to page through, if only for the intriguing graphs and for quotes like this:
Human observers are notoriously suggestible. When told that a given bicycle is special for some reason (carbon forks, selected by a world champion, designed for hard cornering), they easily convince themselves that it is.
And last but not least, the book has a great cover (designed by one Derek George).
Eerbetoon aan de opstandige fietser
Nooit geweten dat fietskoeriers met fixies en blikjes Grolsch jaarlijks op 4 mei een alternatieve herdenking houden, als eerbetoon aan hun voorgangers die actief waren tijdens de bezetting. Pete Jordan schrijft erover in zijn boek De Fietsrepubliek. De herdenking vindt plaats bij een klein monument bij de Martelaarsgracht, waarop staat:
Op deze plek werd op 4 mei 1945 de laatste koerierster uit het verzet, Annick van Hardeveld, door de Duitse bezetter vermoord. Zij was 21 jaar oud. Dit teken is een eerbewijs aan allen die streden tegen onrecht en onderdrukking.
De tekst doet denken aan een passage in het vorige boek van Pete Jordan, Dishwasher. In dat boek ging hij op zoek naar de geschiedenis van de bordenwassers. Hij ontdekte dat radicale bordenwassers een voortrekkersrol hebben gespeeld in de Amerikaanse vakbeweging. Als eerbetoon hing hij op verschillende historische locaties vellen papier op met teksten als:
Op deze plek gooide in 1934 bordenwasser Ramon Bolasques de ruiten in van het Waldorf-Astoria tijdens een staking van de bond van culinaire arbeiders.
En:
Op deze plek streden in maart 1972 vijftien bordenwassers voor werknemersrechten door middel van een succesvolle wilde staking. En ík ben ze daar in elk geval dankbaar voor.
De Fietsrepubliek is een eerbetoon aan de Amsterdamse fietser. Van de ‘bezeten rijstijl’ van de fietsjongens die in de jaren dertig bestellingen afleverden voor winkels en wasserettes, tot de organisaties die hebben gestreden voor ons recht om onder het Rijksmuseum door te fietsen. Jordan schrijft over de anarchistische reputatie van fietsers en hoe de autoriteiten keer op keer probeerden om ze te disciplineren; over de fietsende vorsten Wilhelmina en Juliana; de antifietsmaatregelen van de Duitse bezetter; de strijd voor een fietsvriendelijke stad en de geschiedenis van de fietsendiefstal.
Misschien geen onbekende onderwerpen, maar Jordan komt met verassende details en nieuwe inzichten. Zo had ik geen idee dat Wilhelmina – nog net minderjarig – naar de Raad van State is gestapt omdat ze van haar moeder Emma niet mocht fietsen. Of dat het van het einde van de jaren vijftig tot halverwege de jaren zeventig ‘usance’ was bij confrontaties tussen jongeren en de politie om de doppen van fietsbellen af te schroeven en naar de politie te gooien (tip: lees ook de voetnoten in het boek).
Eén van de onderwerpen waar Jordan zijn tanden in heeft gezet is het witte fietsenplan uit 1965. Provo’s wilden duizenden fietsen in de stad zetten die iedereen gratis mocht gebruiken. Toen de eerste witte fietsen door de politie in beslag waren genomen, legden provo’s bloemen neer en verfden ze een fiets wit bij het standbeeld van anarchist Ferdinand Domela Nieuwenhuis bij het Westerpark.
Er hebben hoogstens enkele tientallen witte fietsen in Amsterdam rondgereden, maar in de internationale pers groeide het project uit tot mythische proporties. Volgens sommigen was het witte fietsenplan een fantastische mislukking, volgens anderen juist een groot succes. De succesverhalen werden als legitimatie gebruikt voor talloze imitaties: gele fietsen in Portland, Oregon; paarse fietsen in Spokane, Washington; rode fietsen in Madison, Wisconsin; blauwe fietsen in Victoria, British Columbia; groene fietsen in Tampa, Florida en roze fietsen in Olympia, Washington.
De Fietsrepubliek staat vol met dit soort verhalen. Iedereen die ook maar iets heeft met fietsen of Amsterdam moet dit boek lezen.
Dit artikel verscheen eerder op Amsterdam Centraal.

