Berliner Gazette

Big Data In Our Hands?

BIG DATA IN OUR HANDS?

Introduction

I. As the wide-ranging powers enjoyed by states and corporations continue to grow, an increasing number of people feel powerless and estranged from political as well as economic decision-making. This situation has been compounded by the rise of state bodies and corporations with bombastic and, indeed, authoritarian ambitions to dominate our increasingly digital age.

NSA representatives have sworn to use any digital means necessary to save the world from evil. Meanwhile, Google-CEO Eric Schmidt has announced that „we want to change the world” through the mobilization of technological innovation, flexible corporate culture, political influence and raw economic power. This attitude dismisses and undermines any criticism (of Google’s or the NSA’s data model, for instance), condemning it as criticism of progress and security in general. To be against Google or the NSA is to be against the common good itself.

Can the commons serve as an alternative to the corporate or state domination of big data, the lifeblood of this dawning digital world? Can it serve as the foundation for collective empowerment? Can it provide a means of criticizing the IT corporations‘ perception of themselves?

II. Today the importance of „big data“ cannot be understated, nor can the power relations that circulate through it be ignored or downplayed. Data processing is becoming a key means by which our society, economy and social lives are being shaped.

However, mass collection, storage and analysis of private data sets is organised by companies, governments and secret service agencies in mostly non-transparent, unregulated ways, lacking effective democratic control. This is undermining fundamental individual and civil rights and the power of the people in general.

Therefore we need to put things into perspective: We, the users, produce more than 75% of the data that make up our digital universe. However, we do not think of those data as the product of our collective labour and therefore as something we should own. Instead large corporations and powerful states own ‚our‘ big data. So we need to ask: Is there a way to turn big data into our digital commons?

III. Both individual and common privacy rights as well as autonomy are fundamental human rights and also common goods that need to be consciously and intentionally cultivated and protected. Therefore, these principles ought to be applied to big data and guide its use and governance.

We, as individuals and collectively, produce data, therefore we should claim, and fight for, the rights as well as capacities to govern and control it. Big data should be a common good. Everyone should have the power to take decisions about big data as a common good and how it should be organized within the commons.

In order to make this happen, the project „Big Data In Our Hands?“ proposes to work on five potential solutions. Before going into the details, please look at the CONTENTS section below to get an overview.

CONTENTS

Big Data Commons
Imagining and constructing the big data commons in order to renegotiate the role and value of data in our post-digital societies and in order to create something like commons data. For details please scroll down or use the navigation bar [Chapters].

Governance of the Data Commons
Creating an international, multi-stakeholder governance group that defines the scope of issues to develop narratives surrounding big data and the digital commons and that provides guidance as well as advisories to all relevant stakeholders. For details please scroll down or use the navigation bar [Chapters].

New Data Infrastructures
Creating new data infrastructures that rely on local networks, community, self-hosting and non-profit ISP, community-owned data centers based on net-neutrality and end to end-encryption throughout all the data channels and free & open source soft- and hardware, open protocols and encryption tools. For details please scroll down or use the navigation bar [Chapters].

Commons Data Centers
Creating new data centers for big data that enable to make the collection and use of big data democratically accountable and to administer data in the interest of the public. For details please scroll down or use the navigation bar [Chapters].

Big Data Enlightenment
Creating tools for big data enlightenment and education that enable to demystify what big data is all about, that empower us, the people, to use big data and the data commons in a friendly, approachable and engaging way for an average user and that make visible the economical value of big data as well as how it is being used by states and corporations. For details please scroll down or use the navigation bar [Chapters].

Big Data Commons

BIG DATA COMMONS

The commons in the anthropocene

The industrial or post-industrial age is increasingly being referred to as the “anthropocene,” referring to an era in which humans are “one of the most important factors that influence the biological, geological and atmospheric processes of the earth” (Wikipedia). Must our understanding of the commons shift as a result? Are our ideas and responsibilities actually evolving together with this shift?

We have tended to associate the idea of the commons with the collective and community-based protection and cultivation of „natural“ phenomena, from the lands that peasants tended and harvested together in the medieval period to today’s rivers and lakes that social movements seek to protect as commons. But can we expand the idea of commons to those ephemeral „second nature“ products of the anthropocene like data itself? Such questions have been posed for many years by free/libre and open source campaigners and others concerned about intellectual property regimes. Drawing on these and other traditions of thought and activism, we want to ask: can big data be understood and (re)claimed as a commons? By whom and under what circumstance? And with what consequences?

From top-down to bottom-up big data

Wikipedia reports that „big data is a broad term for data sets so large or complex that traditional data processing applications are inadequate. Challenges include analysis, capture, data curation, search, sharing, storage, transfer, visualization, and information privacy. The term often refers simply to the use of predictive analytics or other certain advanced methods to extract value from data, and seldom to a particular size of data set.“

In addition to standard definitions of the technology, politics and history of big data, there has developed, over the last few years, a critical discourse that looks at the concept from the perspective of ideology, hegemony, and social and economic power. In this discourse, big data is often viewed, amongst other things, as the „oil“ of the 21st century, as a post-democratic means of surveillance and control or as a theory of everything. We take our cue from this critical discourse and aim to forge a new dimension, building upon the notion that big data are a „phenomenon of co-production“ (Jeanette Hofmann) and therefore demand other modes of more democratic governance.

From open data to commons data

This issue not only concerns data that are generated by institutions and are made publicly accessible by them (as an “act of generosity”), but it also looks at the following potential development:

– focus on all types of data that are generated (including personal data and data produced by individuals) and
– assign them the status of a democratically administered and regulated good, access to which can be negotiated in a democratic manner.

One general issue here, and in particular with respect to the above, is whether individuals should have their “right to be forgotten” extended to also cover big data and search engine data, i.e. whether it is necessary to store a certain type of data in the first place. Not storing such data would make it unnecessary later to administer these data (regardless of who would administer them).

It needs to be clear what part of the big data pool is “private”. This private part should, and needs to, remain private property that belongs to an individual’s personal realm, and is fenced-in by data protection rules. Examples of “private data” are: the content of e-mails and other personal communications; data on which web pages an individual has accessed; records of the data that have been transmitted to websites; and personal data on social networks that are only meant to be shared with friends.

Unlike private data, “public data” have been published on purpose. Examples of public data are: an individual’s website, public profiles on social networks (published by artists or journalists for instance), or blogs. An intermediate position is occupied by individuals who appear in public, but use an alias in doing so in order to escape persecution for their political beliefs, for instance.

From this, it follows that the remaining data (i.e. non-private data) may be used and classified as “commons data”. Before elaborating on this, please note the following:

The line between public and private

We think it is best to say that the question of the line between public and private must be debated and determined by the same authority-yet-to-come that will govern and manage the data commons, rather than suggested before the fact by „us.“ Just a brief example: what about consumer data? What we buy online can reveal a great deal. And what about the „private“ data of public figures whose „private“ communications have an impact on the public good? We should discuss whether the criteria here is to be a suggestion, or a rule.

The legal dimension

Data protection has historically been understood to be an individual right, i.e. the law defines it as a right that an individual is entitled to. However, in the wake of the NSA surveillance scandal a broad debate has broken out over the question whether data protection or the right to informational self-determination are, in fact, not part of a government’s obligation to protect its citizens, i.e. whether data protection is a collective right that the state must actively protect. The concept of socializing big data or of looking at big data from a collective perspective takes its cue from this debate.

Ownership of data

The question of ownership with regard to data remains completely open. Data protection was established as a right of protection, not as a proprietary right. From a legal perspective we are in uncharted waters here. German law only provides for one area where a public good is produced according to predefined values more or less on a trust basis, this being the Interstate Broadcasting Treaty (the „Rundfunkstaatsvertrag“ in Germany). On the basis of this treaty, the parliaments of the German Länder (federal states) commission various bodies to determine how to deal with the public good that is “broadcasting”. This treaty might function as a model for all kinds of legal and practical aspects.

The value of data

We must finally clarify what value data actually have. The reason for this is that the demand for a commons inherently implies a shift from private property to common governance and responsibility. This leads us to try to solve the following issues: 1) what belongs, or should belong, to whom, 2) what is actually worth how much to people, and 3) what something (i.e. in this case “data”) is actually worth, and how we should assess its value.

Today, there is a rapidly growing industry dedicated to measuring, monetizing and commodifying data for use by corporations. Here its value is determined solely by markets. We suggest that the assessment of the value of data should be dependent on a dynamic, continuous reassessment of „our“ own values as they correspond to social realities. In other words, instead (or in addition to) the economic valuation of data, we must also assess its value in terms of how it can serve the principles like democracy, health and wellness, freedom, environmental sustainability and peace.

Assessments by critical thinkers, advertising professionals or terror prevention analysts have one thing in common: The big data discourse is primarily concerned with data that are personal or have been produced by individuals. After all we, the users, produce more than 75% of the data that make up our digital universe. Asking, “what value do data actually have?”, “who owns the data, who has the power to process and cross-reference it?” and “how can we transform big data into commons data?”, are questions precisely about that type of personal data.

In order to lay a basis for a bottom-up approach to big data, we propose to introduce a strategic distinction between personalized and anonymous data. The question is: Which data are necessarily personalized? Which data can be anonymized?

We do not consider anonymized data as a solution to the overall problem. Rather, we see the creation of an anonymized big data pool as the basis for constructing an area of the big data commons, which can be opened to certain practises of data analytics by third parties. After all a big data commons can only be considered a dynamic and flourishing commons if various ways of commons-based peer production are enabled, for instance, data commons-based peer production in the field of research and science, as proposed by Jane Bambauer in her paper „Tragedy of the Data Commons“ (2011).

Against this backdrop one the main objectives on this issue should be to develop a standard that is used by default and which stipulates that data are to be collected anonymously.

Personalized data

The problem with personalized data is that their mere existence can pose a risk to individuals. For instance, many people in the former German Democratic Republic in the 1960s and 1970s unexpectedly did not receive a university place or a promotion they had been counting on. Once the archives of the state security service were opened in the 1990s, they discovered why: information on them gathered by the security service had found its way to other branches of the state like universities or state-owned companies. Often, this information was plain false or construed falsely, but because they were unaware of these secretly collected data, they could not lodge any objection.

To take another example: In countries that had a central register of Jews, the Nazis were able to locate and deport most of the Jews once they had occupied the country in question. In countries that had no such records, the Nazis were only able to locate very few Jews. It is clear that no matter who owns the data or who has control over personalized data (personal profiles), these data can pose a significant risk to individuals.

Note: This is a good historical example, but as they teach in rhetoric: never reach for the Nazi example. It is considered unnecessarily alarmist and often alienates sceptical readers. So it would be great if we could come up with an alternative example.

Today, there are concerns that companies that specialize in tracking personalized data can create highly tailored and specific lists based on everything from Amazon purchases to GPS tracking that can identify, for instance, gay, lesbian, bisexual or people practising otherwise marginalized sexualities. While it is bad enough this data will be sold to marketers, it could also feasibly used by governments or reactionary groups to target individuals.

Anonymized data

Anonymized data are a solution to this problem. The demand for data is growing, and it can probably not be contained by moral, social, political or educational measures alone. But the demand can easily be satisfied by anonymized data. Data collected in such a way delivers the same content (e.g. someone who buys product A will also be interested in product B) without the data being attributable to a specific person. It is important in this case, however, to collect and store each data record separately, because an individual about whom everything except his or her actual identity is known is not really anonymous.

Commons data

After carrying out a subdivision of big data, the data that are to become “commons data” must then to a large extent be anonymized. Anonymization means that (a) the data are no longer private or personal and therefore constitute socialized data, and (b) the data are to a certain degree protected by the anonymization process, i.e., third parties should be prevented by regulation from misusing them; commercial and government bodies should be, for instance, prevented from using them for profiling or surveillance purposes.

The challenge to create regulations for the data protection issue is great: After all computing power is such today that anonymization is easily circumvented by cross-referencing many different datasets. Anonymization is held out as a solution, but a clever algorithm can fairly precisely identify an individual based on anonymous data. Here is a simplified example: One could, feasibly, triangulate an individual from (a) anonymized Uber user data (frequency of travelling to one location, must be their home); (b) anonymized Amazon data (shipped to the same postal code); and (c) a variety of invisible datamarks like type of computer, browser, etc.

According to the current state of the art, in addition to the anonymization of „commons data“ it is also possible to anonymize and/or encrypt personal data. The anonymous communication provider Tor, for instance, enables users to visit a website, without their generating data which would permit a third party to establish a relationship between the individual and his or her access to the website. Also, the content of any personal digital communication may be encrypted so that only the sender and the recipient can read it. Some social networks additionally use technology to ensure that the personal data an individual has published are only shared with the individual’s personal contacts.

Standards for data collection

The provision and collection of data in an anonymized way can generally be achieved by introducing technical standards. One example are settings in the internet browser that enable the user to decide which personal data he or she wants to disclose, and what data is to be transmitted anonymously. Once such a standard has been established, it could be transformed into political and social demands. The “political demand” would advocate the passing of statutory requirements for data collection that would represent an implementation of these standards. The “social demand” would come in the form of pressure on commercial companies to implement these standards (due to pressure from the community, WhatsApp for example, an instant messaging app for smartphones, now implements encryption in its software).

Implications

– At the individual level: users no longer readily surrender data.
– At the regulatory level: the monopolization of data can be challenged. (This would be a completely new development. Normally, the issue of monopolization is debated from a totally different perspective).
– At the social level: the socialization of data becomes a possibility, which has cognitive, political and economic implications, i.e. people are able to participate (a) in an existential part of the environment, (b) in political processes (decision-making on rules, distribution, etc.), and (c) in economic processes (in which “my” data become a potential economic resource which I am able to exploit myself, or I can have it exploited by third parties).

Conclusion

With constructing commons data and with democratically negotiating as well as assessing the value of data, we can initiate a shift from a top-down to a bottom-up narrative on big data. Eventually, we will lay the theoretical and political basis for the big data commons.

Governance of the Data Commons

GOVERNANCE OF THE DATA COMMONS

Vision

Democracy, transparency, individual rights and autonomy are fundamental human rights and also common goods that need to be consciously and intentionally cultivated and protected. Therefore, these principles ought to be applied to big data and guide its use and governance.

We, as individuals and collectively, produce data, therefore we have the right to govern and control it, both as individuals and collectives (a delicate balance between individual and collective rights).

Data processing is becoming a key means by which our society, economy and lives are being organized and shaped. Therefore we should have a key say in how it is used.

We envision the creation of a Global Forum on Big Data and the Commons of and for the commons that will be fiercely autonomous from state and corporate power.

Composition

The form should be amulti-stake-holder network of activists and advocates open to groups, individuals, organizations that exlcudes participation of governments and corporate actors; we will not provide a plan, but lay out values and principles that ought to guide the establishment of a Global Forum on Big Data and the Commons: Values; broad civil society participation and consultation; inclusive and global; capacity and enthusiasm for action and activism, participatory, horizontal, democratic; diverse in perspectives and participants, conscious intent towards active outreach to and inclusion of the excluded but impacted.

Mandate

– Create a robust roadmap to a common data future, perhaps a „Constitution for Common(s) Data“.
– Contribute to the creation of a common digital and data infrastructure.
– Develop narratives, definitions and education on commons data and define the scope and impacts of the issue.
– Develop, advocate and fight for policy and regulation.
– Foster research and collaboration on the risks and possibilities of big data to and for the commons.
– Collaborate with other interested and impacted groups towards this end.
– Always maintain autonomy from corporations and state organizations.

Process

– How will it start?
– The initiators will become an ambassador for the WORKING GROUP FOR BIG DATA COMMONS and we’ll continue to build it out.
– Create a Slack platform for collaboration and to build and share tools, materials, “starter kit”.
– Develop a Listserv (only for announcements).
– Plan a global meet-up at next year’s BG conference to establish the Global Forum on Big Data and the Commons.
– In the next 12-months, encourage local groups for discussion and collaboration and also smaller closed digital groups/communities who can participate.
– Establish a provisional core team who can manage and plan listserv/slack platform/ next year’s gathering and also will be regional ambassadors and organize meet-ups. Meet/check-in once per month and/or as needed.

– How will it be funded?
– For now, we will all volunteer.
– We may crowdfund or ask for donations for costs.

Operations

Look at:
– WSIS (World summit on info soc)
– IGF

Lessons learned:
– Defining the „we“
– What is „civil society“?
– Who is included/excluded?
– How is it funded?
– Pressure from the for-profit actors

New Data Infrastructures

NEW DATA INFRASTRUCTURES

Restitution

In order to have data managements in favor of the common good, so we can ensure autonomous control & non-commercial use of citizen data, as well as equitable access, sustainability and the protection of fundamental and collective rights, we envision the following infrastructure.

Most people live with a ‘privacy paradox’: we know that data is collected about us, and we are bothered by the fact that this means we have little privacy. But paradoxically, we fail to act to protect this privacy, instead (for the most part) we continue to use products and services that produce feelings that privacy is violated. Why? Because these products and services generate ‘network effects’ where participating generates social and economic value. If you don’t participate, you miss out. Thus the privacy paradox is a game that we can’t win.

We propose not to solve this paradox or propose a way to win the game, but to change the game itself. Our vision includes proposals for alternative data management structures that operate at various scales, linked into networked infrastructure (internet infrastructure with its standards and protocols), that have the potential to forestall or challenge the collection of personal or collective information without consent.

Some of the features that we propose exist within technologies that have already been built or proposed both historically or in recent years. Some have not yet been assembled and require us to imagine solutions outside of obvious ones.

Software and devices

The devices through which we share our data and receive information, such as phones, and laptops other connected objects, are the entry points. These data infrastructures should rely on free / open source software and hardware, open protocols and give access to easy end-to-end encryption tools, easy anonymization tools to preserve digital anonymity and privacy.

Network infrastructure

We will have internet/network/phone/energy infrastructures that are owned by us, or in any case run in our interest. For this we need net neutrality so that there are no discriminatory tiers of service, and access is equal. The internet consists of nodes, optical fibre cables, ISPs, points of internet exchange and satellites. Currently the large majority of that entire infrastructure is privately owned. In practice our vision would mean that (parts of) that infrastructure would either be public infrastructure or commons/autonomous infrastructure.

Examples of what would likely be public are internet exchange points (backbone), optical fiber cables and ISPs; on the other hand, what could be owned commonly are networks, but also ISPs. We will also have commons/community driven infrastructure in the form of local networks, community/self-hosted solutions and for-profit ISPs. There will be expanding self-hosted local-community networks that are meshed with a (more basic) public infrastructure.

Data storage

We imagine networked (local) data commons,with both data bases and data repositories, governed in the common interest of the community providing the data. These data banks and repositories are either commonly hosted or publicly hosted. On the other hand there is also a place for private data banks, although what we share with these is up to each indivudual.

– public analytics
– common analytics
– private analytics

Services

We imagine offline services at a community level, caching services from an ecological point of view, and also community alternatives to commercial services (gmail, google doc, skype, doodle, dropbox, google search engine, facebook, ….) (look here). The governance of these alternative services and their funding remain an open question.

Protocols

We will invent and negotiate common protocols, to allow online and offline digital activity, to allow us to deploy discriminating tools for exchanging data (encryption / filter) considering what information we want to exchange with whom, thus allowing direct and partial or complete connection to a database. We will invent and implement new protocols for banking, shopping, exchanging cultural contents, discussing the TOR network and the blockchain technology can be considered as premise.

Agenda

– define structure and aims of alternative data infrastructures,
– define social protocols/governance,
– define economic model,
– drawing exercise: draw internet, draw your data.

Infrastructure

What it is:
– Enabler of data communication (collection) and processing,
– socio-technological (needs to be governed/organized),
– hardware (servers, cables, routers) + software (protocols, libraries, frameworks, algorithms) + devices

What we need:
– have a reliable access to a neutral internet,
– common autonomous infrastructure (hardware & software) to do data analysis,
– organisation to drive analysis.

Protocols and services

What we want:
– being able to use internet in an anonymous way,
– anonymous mail & encrypted/ communication,
– have transparent algorithms,
– public back doors.

Enablers:
– open source hardware,
– open source software,
– open formats.

Software

– encryption,
– should have the ability to chose to whom you open the data (linked to encryption, key management, etc.),
– education on digital security, anonymity and privacy.

Commons Data Centers

COMMONS DATA CENTERS

We wish to engage in a thought experiment: what if big data, which has so much potential but also poses so many threats, could be governed and owned collectively by the public, rather than by corporations or state agencies? What would such commons data centers look like, and how could they be brought into reality?

It will be important here to define what is meant by „public“ as the word has very different meanings in different contexts. Typically, we understand it as „in the trust of the state,“ which is in this case problematic because we have learned not to trust the state with our data because of fears of surveillance and complicity with corporate interests (though there are important differences between states and governments).

Beyond that, we think there is a very important analytic and political distinction to be made between the ideas of the „public“ and the „commons“. Related to this is also the discussion about the nature of „rights,“ such as the right to privacy. When we talk about rights, we often implicitly imagine that some authority can or should enforce and protect rights, usually the state. But the same problems apply as above: can we trust it to do so?

One of the most important questions or challenges in this respect is how we would be able to prevent a new administrative elite from establishing itself in this area. We would also need to determine which principles of knowledge transfer, information security, and information sharing might be applied.

A further challenge is the fact that “decentralizing big data” by organizing it in a multitude of small “commons administration units” would not automatically guarantee that big data would not be used in a detrimental way or made available to third parties for their private interests.

Directives

– If the data are administered in the commons, we must make sure that they are only utilized “in the public interest” and that no individual freedoms are infringed. This will mean, among other things:

– There will always have to be a democratic and transparent decision-making process to determine what to do with certain data in individual cases.

– There will have to be clear statutory rules that stipulate what constitutes an admissible use of the “data” and what does not. These rules must also form the basis for the debates that the commons administration units hold for decision-making.

– The members of the administration units must be elected. The example of the Berlin Round Table on Energy (Berliner Energietisch) and its plan for the public administration of a future public utility in Berlin (Berliner Stadtwerke) shows how this can be done according to a model of grass-roots democracy.

– The specific organizational structure of a “commons administration unit” must be based on the principle that the individuals actually generating or producing the data on the internet must also be able to share democratically in the decision-making on how these data are used. This would take the form of a “producer-user democracy” in the field of data.

Big Data Enlightenment

BIG DATA ENLIGHTENMENT

One fundamental issue in the context of the big data commons concerns strategies of education. Since it is of importance to all of us, how can we make sure that the issue of big data is not exclusively understood and discussed by the corporate and state elites? How can we make sure that all citizens understand the implications, and are able, if necessary, to take counter measures? What measures might these consist of? And, last but not least, how can one carry out a discussion on of this issue so that it has a broad impact? What public places and media should be used?

Demystifying the status quo

– Data grabbing
– Industrial Data Stock Farming
– Data invaders
– Data colonization
– Digital Natives

Campaigning

– Data-giving pledge
– Data Evader Register
– Google employee of the month
– Data evader
– Hacking Star Wars
– Data Vader
„Join the right force“
Data Master
Luke Filewalker

Data grabbing in our hands! Or: re-grabbing!

– Data Mass Index (DMI),
– Big Data in our hands in real time (App showing which data are being collected from the phone),
– Show me the data, show me the money!

Consumer information system

– Data Traffic-Light System (Evaluation)
– „Stiftung Datentest“
– Data instructions for use
– Fair trade data

Open questions

Most of the ideas above go in the direction of rising individual awareness and offering individual solutions. This is a good beginning, but it still misses the collective aspect of the whole topic: The answer to the current status of Big Data needs to include a common approach if it doesn’t want to reproduce individualistic patterns which are part of the problem.

Challenges

Finding catchy images qne narratives for the „common“ aspect of the whole project.

Sources

SOURCES

Journalism and scholarship

* Tragedy of the Data Commons
by Jane Bambauer (formerly Jane Yakowitz), Harvard Journal of Law and Technology, Vol. 25, 2011.

* Is Data the Oil of the 21 Century or a Commons? (German-language)
by Krystian Woznicki, Berliner Gazette, 2011.

* Big data and genetic material should be commons (German-language)
Social anthropologist Shalini Randeria, Principal of the Viennese Institute for Human Sciences (IWM), advocates the rediscovery of the concept of “commons” that are beyond the control of governments and commercial companies.

* The temptations of Big Data (German-language)
by Jeanette Hofmann. Die Versuchungen von Big Data. In: Markus Beckedahl und Andre Meister (Hg.): Jahrbuch Netzpolitik 2012. Von A wie ACTA bis Z wie Zensur. Berlin: epubli, S. 74-79. 2012.

* Socialize the Data Centres!
by Evgeny Morozov. New Left Review 91, January-February 2015.

* Big data from the bottom up
by Nick Couldry and Alison Powell. Big Data & Society, 1 (2). ISSN 2053-9517, 2014.

* Data is not an asset, it’s a liability
by Marko Karppinen. Data is not an asset, it’s a liability. September 2015.

* Alternatives to the controlling corporations (German-language)
By Ayad Al-Ani. Alternativen zu den kontrollierenden Konzernen. Netzpiloten, February 2015.

* Big Data’s Radical Potential
by Pankaj Mehta. Today, big data is used to boost profits and spy on civilians. But what if it was harnessed for the social good? JacobinMag, March 2015.

* Data as commodities (German-language)
by Herbert Zech. Daten als Wirtschaftsgut – Überlegungen zu einem „Recht des Datenerzeugers“. Gibt es für Anwenderdaten ein eigenes Vermögensrecht bzw. ein übertragbares Ausschließlichkeitsrecht? CR, No. 3/2015.

* Revised data retention sought
by Merkel cabinet. Germany’s cabinet has adopted revised legislation on data retention for police probes into severe crimes. Telecoms would log phone and Internet usage for 10 weeks. Privacy advocates and publishers are strongly opposed. May 2015.

* Controlling the future. Edward Snowden and the new era on Earth
by Elmar Altvater. Original in German. Translation by Ben Tendler. First published in Blätter für deutsche und internationale Politik 4/2014

* Engineering the public: Big data, surveillance and computational politics
by Zeynep Tufekci. First Monday, Volume 19, Number 7 – 7 July 2014.

* Politics of Data – Between Post-Democracy and Commons
by Felix Stalder. Lecture at the conference Data Traces, July 3-4, 2015. This is an unedited live written english translation created by Felix Gerloff, an impressive on-the-spot summary. July 2015.

Politics

* International Surveillance: A New French Bill to Collect Data Worldwide!
After the French Constitutional Council censored measures on international surveillance in the Surveillance Law the government fired back with a bill. La Quadrature du Net strongly rejects the unacceptable clauses.

* EU-USA Umbrella Agreement on Data Protection
The agreement puts in place a comprehensive high-level data protection framework for EU-US law enforcement cooperation. The agreement covers all personal data (for example names, addresses, criminal records) exchanged between the EU and the U.S.

* Heiko Maas, give us data sovereignty! #freeyourdata (German-language)
This petition is addressed to Heiko Maas, the German Federal Minister for Justice and Consumer Protection. Quote: “We are supplying the oil of the 21st century for free with no charge for delivery. But what about us?”

* Startups and data protection (German-language)
Hearing in the “Digital Agenda” Committee of the German Parliament. The issue of “open data” was strongly emphasized as an unused resource for innovation. Experts Stephan Noller and Hermann Weiß spoke of “commons data”.

* Data Protection Newsletter (German-language)
An annual German report about data protection. It shows what has been done with the citizen’s data. Transparency without consequences?

* Position paper on commons (German-language)
In 2013 the German Bündnis 90/Grüne (Green Party) parliamentary group adopted a position paper on commons. The paper touched on many areas (including the internet and data) and discussed the social dimension of the commons.

Tools

* Environmental Justice Atlas
Impressive use of lots of data, mapping and open-source infrastructure to map out the connections between global environmental justice struggles.

* Inside Airbnb
A project related to that how big data could be used by social movements. It seeks the publicly accessible data from AirBNB to map and chart its impacts on property prices.

* Mailpile
Mailpile is an e-mail client, a search engine and a personal webmail server. A project to rescue our personal lives from the proprietary cloud.

* New Cloud Atlas
The New Cloud Atlas is a global effort to map each data place that makes up the cloud in an open and accountable way.

* You Broke The Internet
Theory and Practice of a completely encrypted and obfuscated new Internet stack, enabling us to unfold a carefree digital living.

* User Data Manifesto 2.0
Defining basic rights for people to control their own data in the internet age. Control
over user data access. Knowledge of how the data is stored.

Institutions

* Council for Big Data, Ethics, and Society
The Council brings together researchers from diverse disciplines to provide critical social and cultural perspectives on big data initiatives.

* Max Planck Institute for Research on Collective Goods
Research focused on antitrust, regulation and financial stability.

* Open Media Canada
A community-based organization that safeguards the possibilities of the open Internet.

* P2P Foundation
Studies the impact of peer to peer technology and thought on society and aims to be a pluralist network.

* Research Group: Ethics of Big Data
The aim of this interdisciplinary group is develop concrete resources for scholars conducting big data research.

Credits

CREDITS

„Big Data in Our Hands. Re-Claiming the Oil of the 21st Century“ is a long term project by Berliner Gazette in collaboration with civil society actors.

The project started in autumn 2012 at the Digital Backyards conference in Berlin and is scheduled to continue until 2022. Focusing on the commoning of big data, the project most recently culminated in a Berliner Gazette workshop at the UN|COMMONS conference, which took place October 22-24, 2015 in Berlin. This document is the preliminary result of the project.

The chapters „Big Data Commons“ and „Commons Data Centers“ were collaboratively produced before UN|COMMONS in order to prepare and kick off the creative processes at the conference. The chapters „Governance of the Data Commons“, „New Data Infrastructures“ and „Big Data Enlightenment“ are the immediate results of the UN|COMMONS conference.

The Berliner Gazette intends to continue and expand the project in dialogue with a great diversity of civil society actors. Hence the sharing of this document is very welcome as are suggestions and questions on the material at hand as well as on the potential steps to go from here. Please contact us under info(at)berlinergazette.de

People who have participated in this Berliner Gazette initiative so far include Bangi Abdul (tokyo-ritual.jp), Avantika Banerjee (wiredandnetworked.com), Zeljko Blace (Multimedia Institute), Sean Bonner (Safecast.org), Sophie Bloemen (commonsnetwork.eu), Benjamin Cadon (labomedia.org), Martin A. Ciesielski (Medienmosaik), Benjamin Diedrichsen (OPENMEDiAID), Christian Franz (cpc-analytics.com), Max Haiven (Nova Scotia College of Art and Design), Ted Han (Documentcloud.org), Harlo Holmes (New York Times), Hiroyuki Ito (Crypton Future Media), Joi Ito (MIT Media Lab), Ela Kagel (Supermarkt), Anna Magdalena Kedzierska (code4sa.org), Florian Kosak (berlinergazette.de), Tomislav Medak (mi2.hr), Annette Mühlberg (ver.di), Kazushi Mukaiyama (Future University Hakodate), Taketo Oguchi (shift.jp.org), Junichi Oguro (43d), Chris Piallat (berlinergazette.de), Nina Pohler (Hafen City Universität Hamburg), Alison Powell (London School of Economics), Michael Prinzinger (berlinergazette.de), Annika Richterich (Maastricht University), Jaron Rowan (Xnet), Andreas Schneider (Institute for Information Design Japan), Christopher Senf (berlinergazette.de), Lukas Stolz (European Alternatives), Mitsuhiro Takemura (Avec Lab), Keiko Tanaka (Kyoto College of Graduate Studies for Informatics), Edward Viesel (berlinergazette.de) and André Wilkens (Analog ist das neue Bio).

Concept, project coordination and editing: Magdalena Taube and Krystian Woznicki (berlinergazette.de)

The Berliner Gazette is a nonprofit and nonpartisan team of journalists, researchers, artists and coders we analyze and test emerging cultural as well as political practices. For more than 15 years we have been publishing berlinergazette.de under a Creative Commons-License – with more than 900 contributors from all over the world – and also organizing annual conferences and editing books. Visit Berliner Gazette.

The chapter images stem from the documentation of Berliner Gazette conferences including UN|COMMONS at Volksbühne in Berlin, SLOW POLITICS at Supermarkt in Berlin, SLOW POLITICS at Porto in Sapporo. They were taken by Norman Posselt, Andi Weiland and Krystian Woznicki. All contents (text, images, etc.) are licensed under Creative Commons CC BY NC SA.

Big Data in unserer Hand?

BY Berliner Gazette

BIG DATA IN UNSERER HAND?

Einführung

I. Die kontinuierliche Ausweitung der bereits jetzt schon sehr weitreichenden Machtbefugnisse von Staaten und Konzernen führt derzeit bei immer mehr Menschen zu einem Gefühl der Machtlosigkeit und zu einer Entfremdung von den politischen und wirtschaftlichen Prozessen der Entscheidungsfindung. Diese Situation wird verschärft durch den Aufstieg von bestimmten staatlichen Stellen und Konzernen verschärft, die unser digitales Zeitalter dominieren und in bombastischen oder sogar autoritären Plänen schwelgen.

Vertreter der US-amerikanischen Nationalen Sicherheitsbehörde NSA haben geschworen, dass ihnen jedes digitale Mittel recht ist, um die Welt vor dem „Bösen“ zu retten. Und der Chef von Google, Eric Schmidt, kündigte an: „Wir wollen die Welt verändern!“ Zu den von Schmidt dazu ins Auge gefassten Mitteln gehören die Mobilisierung technologischer Neuerungen, eine flexible Unternehmenskultur, politische Einflussnahme und ganz simple wirtschaftliche Macht. Diese Haltung tut jede Form von Kritik (also auch am Datenmodell Googles oder der NSA) als Kritik an Fortschritt und Sicherheit im Allgemeinen ab. Wer gegen Google oder die NSA ist, ist nach diesem Standpunkt schlicht ein Feind des Allgemeinwohls.

Taugen die Commons als Alternative zur Herrschaft der Konzerne oder des Staates über Big Data, dem Lebenselixier der aufblühenden digitalen Welt? Taugt Big Data als Grundlage für eine kollektive Ermächtigung? Kann Big Data als Mittel zur Kritik der Selbstwahrnehmung der IT-Konzerne eingesetzt werden?

II. Die Bedeutung von „Big Data“ kann heute kaum hoch genug eingeschätzt werden. Genauso wenig ist möglich, die Machtbeziehungen zu ignorieren oder herunterzuspielen, die durch Big Data in Gang gesetzt werden. Die Verarbeitung von Daten entwickelt sich zu einem der wesentlichen Mittel, mit denen unsere Gesellschaft und Wirtschaft und unser soziales Leben geformt werden.

Die massenhafte Sammlung, Speicherung und Auswertung von privaten Datensätzen wird jedoch von Unternehmen, Regierungen und Geheimdienststellen auf undurchsichtige und ungeregelte Weise ohne jede demokratische Kontrolle durchgeführt. Dadurch werden grundlegende persönliche und allgemeine Rechte untergraben, genauso wie die Macht der Bevölkerung im Allgemeinen ausgehöhlt wird.

Wir wollen die Frage nach Big Data deshalb erst einmal ins rechte Licht rücken: Wir, die Nutzer, erzeugen mehr als 75 Prozent der Daten, aus denen unser gesamtes digitales Universum besteht. Allerdings begreifen wir diese Daten nicht als das Produkt unserer kollektiven Arbeit und deshalb auch nicht als etwas, das uns gehören sollte. Stattdessen gehören „unsere“ massenhaft erzeugten Daten den Konzernen und den mächtigen Staaten. Wir sollten uns deshalb fragen: Gibt es eine Möglichkeit, Big Data in unsere digitalen Commons zu verwandeln?

III. Sowohl das persönliche als auch das allgemeine Recht auf Privatsphäre und das Recht auf Autonomie gehören zu den grundlegenden Menschenrechten und auch zu den Commons, die bewusst und willentlich kultiviert und geschützt werden müssen. Diese Prinzipien sollten deshalb auch auf Big Data angewendet werden, und sie sollten die Nutzung und Verwaltung von Big Data bestimmen.

Wir erzeugen die Daten – sei es individuell oder kollektiv. Deshalb sollten wir uns auch dafür einsetzen, die Rechte und Kompetenzen zur Verwaltung und Kontrolle dieser Daten zu erlangen. Big Data sollten Commons sein. Jeder sollte die Macht haben, Entscheidungen über Big Data in der Form von Commons zu treffen und darüber zu entscheiden, wie Big Data als Commons verwaltet werden.

Damit diese Forderung Realität wird, erarbeitet das Projekt „Big Data in unserer Hand?“ fünf Lösungsvorschläge. Bevor Sie sich die Vorschläge im Detail anschauen, können Sie sich im folgenden Abschnitt INHALT einen Überblick verschaffen.

Inhalt

INHALT

Big Data-Commons
Hier geht es um die Planung und Errichtung von Big Data-Commons, mit deren Hilfe die Rolle und der Wert von Daten in unseren postdigitalen Gesellschaften neu verhandelt werden können und die die Grundlage für Commons Data sein können. Scrollen Sie nach unten oder benutzen Sie die Navigationsleiste [Chapters], um weitere Informationen zu diesem Thema zu erhalten.

Governance der Daten-Commons
Hier geht es um die Schaffung einer internationalen, interessengruppenübergreifenden Steuerungsgruppe, die den Umfang der für die Entwicklung von Erzählungen rund um Big Data und digitale Commons notwendigen Themen festlegt und alle wesentlichen Interessengruppen mit Beratungsleistungen und Tipps zur Seite steht. Scrollen Sie nach unten oder benutzen Sie die Navigationsleiste [Chapters], um weitere Informationen zu diesem Thema zu erhalten.

Neue Daten-Infrastrukturen
Hier geht es um die Schaffung neuer Dateninfrastrukturen, die auf Folgendem aufbauen: lokalen Netzwerken; Internetdienstanbietern auf gemeinschaftlicher, selbst gehosteter und gemeinnütziger Basis; im kollektiven Besitz befindlichen und auf dem Grundsatz der Netzneutralität aufbauenden Datenzentren mit Ende-zu-Ende-Verschlüsselung in allen Datenkanälen; Freier und quelloffener Software und Hardware; sowie offenen Protokollen und offenen Verschlüsselungswerkzeugen. Scrollen Sie nach unten oder benutzen Sie die Navigationsleiste [Chapters], um weitere Informationen zu diesem Thema zu erhalten.

Datenzentren als Commons
Hier geht es um die Schaffung neuer Datenzentren für Big Data, durch die die Erfassung und Nutzung von Big Data demokratischer Kontrolle unterliegt und mit denen Daten im Interesse der Allgemeinheit verwaltet werden können. Scrollen Sie nach unten oder benutzen Sie die Navigationsleiste [Chapters], um weitere Informationen zu diesem Thema zu erhalten.

Big Data-Aufklärung
Hier geht es um die Schaffung von Werkzeugen zur Aufklärung und Bildung im Bereich Big Data, mit denen das Thema Big Data entmystifiziert werden kann. Dadurch soll die Bevölkerung außerdem ermächtig werden Big Data und Daten-Commons zu nuten und diese auch zugänglich zu machen. Außerdem soll der wirtschaftliche Wert von Big Data und die Art, wie Staaten und Konzerne Big Data nutzen, sichtbar gemacht werden. Scrollen Sie nach unten oder benutzen Sie die Navigationsleiste [Chapters], um weitere Informationen zu diesem Thema zu erhalten.

Big Data-Commons

BIG DATA-COMMONS

Die Commons im Anthropozän

Das industrielle oder postindustrielle Zeitalter wird immer öfter als das „Anthropozän“ bezeichnet, also als eine Ära, in der die Menschen „zu einem der wichtigsten Einflussfaktoren auf die biologischen, geologischen und atmosphärischen Prozesse auf der Erde geworden“ sind (Wikipedia). Es stellt sich nun die Frage, ob sich im Zuge dessen auch unser Verständnis der Commons verschieben muss. Entwickeln sich unseren Ideen und unsere Verantwortung mit dieser Verschiebung weiter?

In der Vergangenheit haben wir unter dem Konzept der Commons vor allem die kollektive und gemeinschaftsbasierte Kultivierung und den Schutz „natürlicher“ Gegebenheiten verstanden. Dies reicht von dem von Kleinbauern und Landarbeitern im Mittelalter kollektiv bestellten und abgeernteten Land bis hin zu Flüssen und Seen, die soziale Bewegungen heute als Gemeingut schützen wollen. Aber können wir die Idee der Commons so stark erweitern, dass es solch flüchtige Produkte der „zweiten Natur“ des „Anthropozäns“ wie Daten umfasst?

Diese Frage stellen sich Aktivisten aus dem Bereich der Freien und quelloffenen Software und der Freien Inhalte sowie aus dem Bereich des geistigen Eigentumsrechts schon seit vielen Jahren. Wir wollen auf diesen und anderen Traditionen der Theorie und Praxis aufbauen und nun Folgendes fragen: Können wir Big Data als Commons auffassen und uns (wieder) aneignen? Falls ja, wer wird dies tun und unter welchen Umständen? Was sind die Folgen?

Big Data: aus Top-down wird Bottom-up

Gemäß der englischsprachigen Wikipedia ist „Big Data ein weit gefasster Begriff für Datensätze, die so umfangreich oder so komplex sind, dass die üblichen Anwendungen der Datenverarbeitung dafür nicht mehr geeignet sind. Zu den Herausforderungen in diesem Bereich gehören die Auswertung, Erfassung, Pflege, Suche, Verteilung, Speicherung, Übertragung und Visualisierung sowie der Datenschutz. Der Begriff bezieht sich häufig schlicht auf die prädiktive Analytik oder auf andere fortschrittliche Methoden zur Abschöpfung eines in Daten verborgenen Wertes. Der Begriff bezieht sich selten auf den tatsächlichen Umfang eines Datensatzes.“

Neben Standarddefinitionen zu Technik, Politik und Geschichte von Big Data hat sich in den letzten Jahren ein kritischer Diskurs zu Big Data im Hinblick auf Ideologie, Hegemonie sowie soziale und wirtschaftliche Macht entwickelt. In diesem Diskurs wird Big Data unter anderem als „Öl des 21. Jahrhunderts“, postdemokratisches Überwachungs- und Kontrollinstrument oder als „Weltformel“ betrachtet. Wir orientieren uns an diesem kritischen Diskurs und versuchen eine neue Dimension dazu zu erschließen, aufbauend auf der Vorstellung, dass Big Data ein „Phänomen der Koproduktion“ (Jeanette Hofmann) ist und deshalb andere Arten einer demokratischeren Verwaltung erfordert.

Von Open Data zu Commons Data

Es geht hierbei nicht nur um Daten, die von Institutionen generiert und (als Akt der Gnade) öffentlich zugänglich gemacht werden. Auch die folgende potenzielle Entwicklung soll betrachtet werden:

– alle Daten, auch die personenbezogenen und durch Individuen produzierten Daten, rücken ins Blickfeld

und

– bekommen einen Status als demokratisch verwaltetes und reguliertes Gut, dessen Zugang demokratisch verhandelt werden kann.

Eine Frage ist generell und im Besonderen in diesem Zusammenhang, ob es nicht ein „Recht auf Vergessenwerden“ auch hinsichtlich Big Data und Suchmaschinendaten geben sollte, das heißt ob bestimmte Daten überhaupt gespeichert werden sollten, um dann von (wem auch immer) verwaltet zu werden.

Es muss zunächst geklärt werden, welcher Teil des Big-Data-Pools „privat“ und damit auch personenbezogener und durch Datenschutz eingehegter Privatbesitz bleiben muss oder soll. Beispiele für solche privaten Daten sind der Inhalt von E-Mails und anderer persönlicher Kommunikation; welche Internetseiten besucht wurden; welche Daten an Websites übermittelt wurden; sowie persönliche Daten auf sozialen Netzwerken, welche nur für Freunde freigegeben wurden.

Im Gegensatz dazu stehen Daten, die bewusst veröffentlicht wurden. Beispiele dafür sind die persönliche Webseite, öffentliche Profile auf sozialen Netzwerken (beispielsweise als Künstler oder Journalist) und Blogs. Dazwischen gibt es Menschen, die öffentlich auftreten, aber unter einem Pseudonym, um beispielsweise nicht aufgrund ihrer politischen Anschauung verfolgt zu werden.

Daraus folgt, dass alle Daten, die nicht privat sind und bei einer solchen Aufteilung übrig bleiben, Commons Data werden können. Bevor wir das weiter ausführen, gilt es folgendes zu bedenken:

Abgrenzung von öffentlichen und privaten Daten

Unserer Meinung nach muss die Frage der Abgrenzung von öffentlichen und privaten Daten noch diskutiert werden. Diese Unterscheidung sollte aber eher von der zukünftigen Verwaltungsstelle debattiert und festgelegt werden, die Commons Data steuern und verwalten soll, als dass „wir“ uns vor der Gründung einer solchen Stelle den Kopf darüber zerbrechen. Hier dennoch einige beispielhafte Fragestellungen, die es zu klären gilt: Was soll mit Verbraucherdaten passieren? Was wir im Internet kaufen, sagt ja einiges über uns aus. Was soll mit „privaten“ Daten von Persönlichkeiten des öffentlichen Lebens passieren, deren „private“ Kommunikation eine Auswirkung auf das Allgemeinwohl hat? Wir sollten auch darüber sprechen, ob die hier festgelegten Kriterien eher Vorschlags- oder eher Regelcharakter haben sollen.

Rechtliche Dimension

Was die rechtliche Dimension betrifft, so wird der klassische Datenschutz als Individualrecht verstanden. Das bedeutet, dass der Datenschutz gesetzlich als Recht angelegt ist, welches einem Menschen als Individuum zusteht. Im Zuge des NSA-Überwachungsskandals gibt es nun jedoch eine breite Debatte darüber, dass Datenschutz (oder informationelle Selbstbestimmung) eigentlich eine staatliche Schutzpflicht ist; dass es sich hierbei also um ein kollektives Recht handelt, welches der Staat aktiv schützen muss. Diese Frage ist auf jeden Fall ein Anknüpfungspunkt für den Ansatz, Big Data zu vergesellschaften oder unter einem kollektiven Gesichtspunkt zu betrachten.

Eigentumsfrage bei Daten

Die Eigentumsfrage bei Daten ist weiter völlig offen. Der Datenschutz ist eben als Schutzrecht und nicht als Eigentumsrecht angelegt. Das ist juristisches Neuland. Es gibt im deutschen Recht eigentlich nur einen Bereich, in dem nach definierten Werten ein öffentliches Gut quasi treuhänderisch hergestellt wird: der Rundfunkstaatsvertrag. Auf dessen Basis legen, vom Gesetzgeber des jeweiligen Bundeslandes beauftragt, verschiedene Gremien fest, wie mit dem öffentlichen Gut „Rundfunk“ umzugehen ist. Hier kann man vielleicht rechtliche und praktische Anleihen machen.

Der Wert von Daten

Wir müssen schließlich die Frage des Werts von Daten klären, weil die Forderung nach Commons auch eine Verschiebung weg vom Privateigentum und hin zu einer gemeinschaftlichen Verwaltung und Verantwortung in Gang setzt. Damit wird die Diskussion über Folgendes eröffnet: 1) Was gehört wem oder sollte wem gehören? 2) Was ist wem etwas wert? 3) Was ist etwas (also hier „Daten“) eigentlich wert, und wie ist dieser Wert zu bemessen?

Es gibt heute eine stetig wachsende Industrie, die im Auftrag von Konzernen Daten misst, monetarisiert und handelbar macht. In diesem Fall wird der Wert von Daten ausschließlich durch Märkte bestimmt. Wir schlagen dagegen vor, dass die Beurteilung des Werts von Daten sich auf eine dynamische und fortlaufende Neubewertung „unserer“ eigenen Werte stützt und darauf, wie sich diese Werte zu den sozialen Realitäten verhalten. Mit anderen Worten sollten wir statt (oder zusätzlich zu) einer wirtschaftlichen Bewertung von Daten eine Bewertung dahingehend durchführen, wie Daten grundlegenden Werten wie Demokratie, Gesundheit und Wohlbefinden, Freiheit, der ökologischen Nachhaltigkeit oder dem Frieden dienen können.

Die verschiedenartigen Einschätzungen, die von Werbemanagern, kritischen Intellektuellen und Analysten aus dem Bereich Terrorismusvorbeugung abgegeben werden, haben eines gemeinsam: Der Diskurs über Big Data betrifft vor allem Daten, die personenbezogen sind oder von Individuen erzeugt wurden. Wir, die Nutzer, erzeugen schließlich mehr als 75 Prozent der Daten, aus denen unser digitales Universum besteht. Die Fragen „welchen Wert haben Daten eigentlich?“, „wem gehören die Daten, und wer hat die Befugnis, sie zu verarbeiten und mit Querverweisen zu versehen?“ und „wie können wir ‚Big Data‘ in ‚Commons Data‘ verwandeln?“ beziehen sich auf eben diese persönlichen Daten.

Um die Basis für ein Bottom-up-Konzept für den Umgang mit Big Data zu schaffen, schlagen wir die Einführung einer strategischen Unterscheidung zwischen „personalisierten“ und „anonymen“ Daten vor. Folgende Fragen stellen sich dabei: Welche Daten müssen personalisiert vorliegen? Welche Daten können dagegen anonymisiert werden?

Aus unserer Sicht sind anonymisierte Daten jedoch noch keine Lösung des Gesamtproblems. Wir sehen die Schaffung eines anonymisierten Big-Data-Pools eher als Basis für die Errichtung eines bestimmten Bereiches der Big Data Commons an, zu dem Dritte zur Durchführung bestimmter Datenanalyseverfahren Zugang bekommen sollen. Die Big Data-Commons können schließlich nur zu dynamischen und florierenden Commons werden, wenn darin verschiedene Formen der auf dem Prinzip der Gemeingutökonomie basierenden kollegialen und hierarchiefreien Produktionsweise (commons-based peer production) möglich sind, beispielsweise eine kollegiale und hierarchiefreie Produktion von Commons Data im Bereich von Forschung und Wissenschaft, wie von Jane Bambauer in ihrer Veröffentlichung „Tragedy of the Data Commons“ (2011) vorgeschlagen.

Vor diesem Hintergrund sollte eines der Hauptziele in diesem Zusammenhang die Entwicklung eines Standards sein, der als feste Vorgabe dienen soll und der vorschreibt, dass sämtliche Daten anonym zu erfassen sind.

Personalisierte Daten

Das Problem personalisierter Daten ist, dass ihre bloße Existenz ein Risiko für Menschen darstellen kann. Viele Menschen in der ehemaligen Deutschen Demokratischen Republik erhielten beispielsweise in den 1960er- und 1970er-Jahren unerwarteterweise keinen Studienplatz oder keine Beförderung, obwohl sie damit gerechnet hatten. Als dann die Archive des Ministeriums für Staatssicherheit in den 1990er-Jahren geöffnet wurden, fanden sie den Grund dafür heraus: Informationen, die von der Staatssicherheit über sie gesammelt worden waren, waren zu anderen staatlichen Stellen, beispielsweise Universitäten oder staatseigenen Unternehmen, gelangt. Diese Informationen waren oft schlicht falsch oder waren falsch interpretiert worden. Weil aber die Menschen keine Kenntnis von den geheim erhobenen Daten hatten, konnten sie dagegen auch keinen Widerspruch einlegen.

Um ein anderes Beispiel zu nehmen: In Ländern, in denen eine zentrale Judenkartei existierte, konnten die Nazis nach der Besetzung des Landes einen Großteil der Juden auffinden und deportieren. In Ländern ohne solche Aufzeichnungen konnten die Nazis nur sehr wenige Juden finden. Das heißt egal in welchem Besitz und unter welcher Kontrolle sich personalisierte Daten (Personenprofile) befinden, sie können ein erhebliches Risiko für Menschen darstellen.

Eine Anmerkung: Das letzte Beispiel ist ein gutes Beispiel aus der Geschichte. Wie man jedoch im Rhetorikunterricht lernt, sollte man Nazi-Beispiele vermeiden, weil sie als unnötige Panikmache angesehen werden und auf skeptische Leser oft abschreckend wirken. Es wäre also toll, wenn wir ein anderes Beispiel finden könnten.

Heute wird bereits befürchtet, dass Unternehmen, deren Geschäft in der Erfassung und Auswertung von personalisierten Daten besteht, auf Basis einer ganzen Palette von Daten, beispielsweise Käufen bei Amazon oder GPS-Tracks, genaue und exakt auf bestimmte Anforderungen zugeschnittene Listen erstellen können, mit denen zum Beispiel schwule, lesbische, bisexuelle Menschen oder Menschen mit einer anderen marginalisierten Sexualpraktik identifiziert werden können. Während es schon schlimm genug ist, dass diese Unternehmen die Daten an Vermarkter verkaufen, ist es jedoch genauso denkbar, dass die Daten von Regierungen oder reaktionären Gruppen genutzt werden, um einzelne Personen ins Visier zu nehmen.

Anonymisierte Daten

Anonymisierte Daten stellen einen Ausweg aus dieser Problematik dar. Die Nachfrage nach Daten wächst und kann vermutlich nicht alleine durch moralische, gesellschaftliche, politische oder bildungstechnische Maßnahmen eingedämmt werden. Aber der Bedarf kann durch anonymisierte Daten gedeckt werden. Derartig erhobene Daten liefern denselben Inhalt (beispielsweise: wer A kauft, der interessiert sich auch für B), ohne dass sie einer bestimmten Person zugeordnet werden können. Hierbei muss jedoch darauf geachtet werden, dass die Datensätze separat erhoben und gespeichert werden, denn eine Person, über die ich alles weiß, außer ihrer Identität, ist nicht wirklich anonym.

Commons Data

Nach einer Unterteilung von Big Data muss eine weitgehende Anonymisierung derjenigen Daten vorgenommen werden, die Commons Data werden sollen. Anonymisierung bedeutet, a) dass diese Daten nicht mehr privat oder personenbezogen sind und damit vergemeinschaftet sind und b) dass diese Daten bis zu einem gewissen Grad dem Schutz der Anonymisierung unterstehen, also dass der Missbrauch durch Dritte, beispielsweise die Erstellung von Persönlichkeitsprofilen oder die Überwachung durch staatliche oder privatwirtschaftliche Stellen, durch Regelung ausgeschlossen wird.

Die Herausforderungen bei der Schaffung von Regelungen im Bereich Datenschutz sind groß. Schließlich ist die Rechenleistung aktueller Computer so groß, dass es ein Leichtes ist, eine Anonymisierung mithilfe von Querverweisen innerhalb einer Reihe von Datensätzen auszuhebeln. Die Anonymisierung wird häufig als Lösung angeboten, aber ein intelligenter Algorithmus ist in der Lage, mit ziemlicher Sicherheit ein Individuum auch auf der Basis anonymer Daten zu identifizieren. Ein vereinfachtes Beispiel: Es ist durchaus im Bereich des Möglichen, ein Individuum anhand folgender drei Merkmale zu identifizieren: a) anonymisierte Daten eines Nutzers des Fahrten-Vermittlungsdienstes „Uber“ (sehr häufige Fahrten zu einem bestimmten Ort deuten auf die eigene Wohnung hin), b) anonymisierte Daten von Amazon (Versand an die gleiche Postleitzahl) und c) eine Reihe unsichtbarer Datenmarkierungen, beispielsweise den Typ des Computers oder des Internetbrowsers betreffend.

Neben der Anonymisierung von Commons Data können auch persönliche Daten nach dem heutigen Stand der Technik anonymisiert und sogar verschlüsselt werden. Zum Beispiel kann man unter Verwendung des Anonymisierungsdienstes TOR eine Internetseite besuchen, ohne dass Daten anfallen, die einen Bezug zwischen der Person und dem Webseitebesuch zulassen. Der Inhalt von persönlicher digitaler Kommunikation kann außerdem so verschlüsselt werden, dass nur Sender und Empfänger ihn lesen können. Und es existieren soziale Netzwerke, bei denen technisch sichergestellt ist, dass die veröffentlichten persönlichen Daten nur den eigenen Kontakten zugänglich sind.

Standards zur Datenerhebung

Das Bereitstellen und Erfassen von anonymisierten Daten kann grundsätzlich mithilfe von technischen Standards durchgeführt werden. Ein Beispiel dafür sind Einstellungen im Browser, die Benutzern die Wahl geben, welche persönlichen Daten sie preisgeben möchten und welche Daten anonym übermittelt werden sollen. Ein solcher Standard könnte – einmal etabliert – zu einer politischen und einer gesellschaftlichen Forderung werden. Politisch beträfe dies die Forderung nach gesetzlichen Vorgaben für die Datenerfassung, mit denen solche Standards implementiert würden. Gesellschaftlich beträfe dies den Druck auf Unternehmen, diese Standards auch wirklich zu implementieren (beispielsweise implementiert „WhatsApp“, ein Sofortnachrichtendienst für Smartphones, mittlerweile auf Druck der Community eine Verschlüsselung).

Implikationen

– Auf der individuellen Ebene: Nutzer geben Daten nicht mehr ohne Weiteres weiter.
– Auf der regulatorischen Ebene: Die Monopolisierung von Daten kann in Frage gestellt werden (was neu ist, sonst wird das Thema „Monopolisierung“ immer nur unter anderen Gesichtspunkten verhandelt).
– Auf der sozialen Ebene: Eine Vergesellschaftung von Daten wird möglich, was kognitive, politische und ökonomische Folgen hat, nämlich die Beteiligung der Menschen a) an einem existenziellen Teil der Umwelt, b) an politischen Prozessen (unter anderem das Treffen von Entscheidungen über Regeln oder die Verteilung) und c) an ökonomischen Prozessen (indem „meine“ Daten zu einer potenziellen ökonomischen Ressource werden, die ich selber auswerte oder von Dritten auswerten lasse).

Schlussfolgerung

Die Schaffung von Commons Data und das demokratische Aushandeln und Bestimmen des Werts von Daten versetzen uns in die Lage, die Erzählung über Big Data allmählich von einer Top-down-Erzählung in eine Bottom-up-Erzählung zu verwandeln. Dadurch werden wir im Laufe der Zeit in die Lage versetzt, die theoretische und politische Grundlage für Big Data-Commons zu schaffen.

Governance der Data Commons

GOVERNANCE DER DATA COMMONS

Vision

Demokratie, Transparenz, persönliche Rechte und Autonomie sind grundlegende Menschenrechte und auch Gemeingüter, die bewusst und willentlich kultiviert und geschützt werden müssen. Diese Prinzipien sollten deshalb auch auf Big Data angewendet werden, und sie sollten dessen Nutzung und Verwaltung bestimmen.

Wir erzeugen die Daten – sei es individuell oder kollektiv. Deshalb sollten wir das Recht haben, die Daten zu verwalten, und sollten auch die Verfügungsgewalt darüber haben, sowohl als Individuen als auch als Gemeinschaften (ein heikler Balanceakt zwischen individuellen und kollektiven Rechten).

Die Datenverarbeitung entwickelt sich zu einem der grundlegenden Mittel, mit denen unsere Gesellschaft und Wirtschaft und unser Leben organisiert und geformt wird. Wir sollten deshalb auch auf grundlegende Weise mitbestimmen können, wie sie durchgeführt wird.

Wir stellen uns die Schaffung eines „Weltforums zu Big Data und Commons“ vor. Dieses Forum sollte aus den Commons hervorgehen, den Commons dienen und auf kämpferische Weise unabhängig von staatlicher Macht und von der Macht der Unternehmen bleiben.

Zusammensetzung

– Das Forum sollte ein interessengruppenübergreifendes Netzwerk von Aktivisten und Befürwortern der Sache sein, das offen für jede Art von Gruppen, Individuen und Organisationen ist. Es sollte jedoch ohne die Teilnahme von Regierungen und Akteuren aus dem Unternehmensbereich auskommen;
– Wir werden keinen Plan zur Verfügung stellen, sondern vielmehr Werte und Prinzipien aufstellen, die dazu geeignet sind, die Schaffung eines „Weltforums zu Big Data und Commons“ zu begleiten. Dies können zu Grunde liegende Werte sein:

– eine breite Teilnahme und Konsultation der Zivilgesellschaft;
– integrativ und global;
– Kapazität und Begeisterung für Aktionen und Aktivismus;
– partizipatorisch, horizontal und demokratisch;
– Vielfalt an Perspektiven und Teilnehmern;
– bewusster Wille zur Einbindung von Ausgeschlossenen, die jedoch Betroffene sind, und zum aktiven Kontakt mit diesen.

Mandat

– Schaffung eines robusten Fahrplans zu Realisierung einer gemeinsamen Datenzukunft; das könnte eventuell eine „Verfassung für Kollektiv- und Commons Data“ sein;
– Beitrag zur Errichtung einer kollektiven Digital- und Dateninfrastruktur;
– Entwicklung von Erzählungen, Definitionen und Bildung zum Thema Commons Data und Festlegung des Umfangs und der Auswirkungen dieses Themas;
– Entwicklung, Unterstützung und Engagement im Bereich Politik und Vorschriften;
– Unterstützung von Forschung und Kooperation im Bereich der Risiken und Möglichkeiten von Big Data für das Commons;
– Zusammenarbeit mit anderen Interessen- und Betroffenengruppen zu diesem Zweck;
– Dauerhafte Aufrechterhaltung von Autonomie gegenüber Konzernen und staatlichen Organisationen.

Prozess

Wie startet der Prozess?
– Die Initiatoren werden Botschafter für die Arbeitsgruppe für die Big Data-Commons, und wir werden die Arbeitsgruppe weiter ausbauen;
– Einrichtung einer Slack-Plattform für die Zusammenarbeit und um Werkzeuge, Materialien und ein „Einsteigerpaket“ zu kreieren und zu teilen;
– Entwicklung eines Listservers (nur für Ankündigungen);
– Planung einer globalen Zusammenkunft bei der BG-Konferenz im nächsten Jahr, um das Weltforum zu Big Data und Commons zu gründen;
– in den nächsten 12 Monaten: Unterstützung von lokalen Gruppen zur Diskussion und Zusammenarbeit sowie von kleineren geschlossenen digitalen Gruppen oder Gemeinschaften, die auch teilnehmen können;
– Gründung eines provisorischen Kernteams, das Listserv/Slack-Plattform/Zusammenkunft nächstes Jahr planen und leiten und dessen Mitglieder als regionale Botschafter fungieren und Zusammenkünfte organisieren. Monatliche Treffen, je nach Bedarfs;

Wie wird das Ganze finanziert?
– Derzeit ist geplant, dass alle ehrenamtlich tätig sind;
– Die Finanzierung per Crowdfunding ist eine Möglichkeit, oder wir werben für die Kosten Spenden ein.

Praktische Arbeiten

Folgendes sollte geprüft werden:
– der Weltgipfel zur Informationsgesellschaft
– das Internet Governance Forum (IGF)

Gewonnene Erkenntnisse:
– Wie wird das „Wir“ definiert?
– Was ist die Zivilgesellschaft?
– Wer gehört dazu, und wer ist ausgeschlossen?
– Wie finanziert sich das?
– Druck durch die gewinnorientierten Akteure

Neue Daten-Infrastrukturen

NEUE DATEN-INFRASTRUKTUREN

Rückforderung

Die notwendige Infrastruktur zur Verwaltung von Daten im Sinne des Allgemeinwohls, zur Sicherstellung der autonomen Kontrolle und nichtkommerziellen Verwendung von Bürgerdaten sowie zur Sicherstellung des gleichberechtigten Zugangs, von Nachhaltigkeit und des Schutzes von grundlegenden und kollektiven Rechten, könnte aus unserer Sicht wie folgt aussehen.

Die meisten Menschen leben mit einem „Privatsphärenparadox“: Wir wissen, dass über uns Daten gesammelt werden, und das ärgert uns, weil wir dadurch nur noch eine eingeschränkte Privatsphäre haben. Paradoxerweise tun wir jedoch nichts, um diese Privatsphäre zu schützen, stattdessen nutzen wir (größtenteils) weiter die Produkte und Dienstleistungen, die uns das Gefühl vermitteln, dass in unsere Privatsphäre eingegriffen wird. Der Grund dafür ist, dass diese Produkte und Dienstleistungen „Netzwerkeffekte“ erzeugen, bei denen die Teilnahme am Netzwerk uns einen sozialen oder wirtschaftlichen Wert bringt: „Wenn du nicht mitmachst, entgeht dir etwas.“ Das Privatsphärenparadox ist deshalb ein Spiel, das wir nicht gewinnen können.

Unser Vorschlag geht dahin, dass wir weder versuchen, das Paradox aufzulösen, noch das Spiel zu gewinnen. Vielmehr wollen wir die Spielregeln verändern. Nach unserer Vorstellung gehören dazu Vorschläge zur Einführung alternativer Datenverwaltungsstrukturen, die auf verschiedene Größen skaliert werden können und in eine vernetzte Infrastruktur eingebunden werden (die Internet-Infrastruktur mit ihren Standards und Protokollen). Diese alternativen Strukturen sollen mit der Fähigkeit ausgestattet werden, das Sammeln von persönlichen oder kollektiven Informationen ohne Zustimmung zu verhindern oder zu bekämpfen.

Einige der Merkmale, deren Einsatz uns vorschwebt, sind bereits in existierender oder konzipierter Technologie enthalten; dabei kann es sich sowohl um relativ alte Technologie als auch erst kürzlich entstandene Technologie handeln. Andere Merkmale gibt es dagegen noch nicht. Hier müssen wir über Lösungen nachdenken, die nicht sofort naheliegend sind.

Software und Geräte

Die Geräte, mit denen wir unsere Daten untereinander austauschen und Informationen empfangen, beispielsweise Telefone, Laptops oder andere vernetzte Geräte, sind unsere Zugangspunkte. Diese Dateninfrastrukturen sollten sich auf Freie oder quelloffene Soft- und Hardware sowie auf offene Protokolle stützen und sollten einen einfachen Zugang zu Ende-zu-Ende-Verschlüsselung und zu einfach zu handhabenden Anonymisierungswerkzeugen ermöglichen, um so die digitale Anonymität und Privatsphäre zu wahren.

Netzwerkinfrastruktur

Wir werden über Infrastrukturen für Internet, Netzwerk, Telekommunikation und Energie verfügen, welche uns gehören oder zumindest in unserem Auftrag betrieben werden. Dafür benötigen wir Netzneutralität, damit es keine benachteiligenden Abstufungen beim Service gibt und der Zugang gleichberechtigt ist.

Das Internet besteht aus Knotenpunkten, Glasfaserkabeln, Internetdienstanbietern, Austauschpunkten und Satelliten. Derzeit befindet sich der Großteil der gesamten Infrastruktur in privatem Besitz. In der Praxis gehen unsere Vorstellungen dahin, dass (zumindest teilweise) diese Infrastruktur sich entweder im öffentlichen Besitz bzw. in Form eines Commons-Besitzes oder eines autonomen Systems befinden wird.

Beispiele für mögliche Infrastruktur im öffentlichen Besitz sind: Knotenpunkte des Kernnetzes (Backbone), Glasfaserkabel und Internetdienstanbieter. Andererseits könnten Netzwerke oder Internetdienstanbieter ebenfalls als Commons verwaltet werden.

Wir werden auch eine Infrastruktur besitzen, die gemeinschaftlich oder als Commons gehalten wird. Diese Infrastruktur wird lokale Netzwerke und selbst oder gemeinschaftlich gehostete Lösungen, aber auch gewinnorientierte Internetdienstanbieter umfassen.

Es wird zudem stetig wachsende und selbst gehostete Netzwerke in örtlichen Gemeinschaften geben, die mit einer (grundlegenderen) öffentlichen Infrastruktur verflochten und verbunden werden.

Datenspeicherung

Wir stellen uns ein vernetztes (lokales) Daten-Commons vor, das über Datenbanken und Datenspeicher verfügt, welche im allgemeinen Interesse derjenigen Gemeinschaft verwaltet werden, die die Daten zur Verfügung stellt. Diese Datenbanken und Datenspeicher werden entweder gemeinschaftlich oder öffentlich gehostet. Es gibt jedoch auch einen Platz für private Datenbanken. Welche Daten diesen privaten Betreibern zur Verfügung gestellt werden, muss jeder selbst entscheiden. Es gibt also diese Drei:
– öffentliche Analytik
– gemeinschaftliche Analytik
– private Analytik

Dienstleistungen

Folgendes stellen wir uns darunter vor: Dienstleistungen außerhalb des Internets auf der Ebene von Gemeinschaften; Cache-Dienste, die einen ökologischen Zweck erfüllen; und gemeinschaftliche Alternativen zu kommerziellen Dienstleistungen (Gmail, Google Docs, Skype, Doodle, Dropbox, Google-Suchmaschine, Facebook etc.) (siehe hier). Die Frage der Verwaltung dieser alternativen Dienstleistungen und deren Finanzierung ist noch offen.

Protokolle

Wir werden allgemeine Protokolle schaffen und vereinbaren, mit denen wir innerhalb und außerhalb des Internets arbeiten können; die uns den Einsatz unterscheidungsfähiger Werkzeuge für den Datenaustausch ermöglichen (Verschlüsselung und Filter); und die uns die Entscheidung ermöglichen, welche Informationen wir mit wem austauschen möchten, und so unmittelbar einen teilweisen oder vollständigen Zugang zu einer Datenbank erlauben. Wir werden neue Protokolle für Banking, Einkaufen, den Austausch kultureller Inhalte und für Diskussionstätigkeit schaffen und implementieren. Das TOR-Netzwerk und die Block-Chain-Technologie können dazu als Grundlage angesehen werden.

Agenda

– Definition von Struktur und Zielen für alternative Dateninfrastrukturen,
– Definition von sozialen Protokollen und sozialer Verwaltung,
– Definition des Wirtschaftsmodells,
– Zeichenübung: zeichne das Internet; zeichne deine Daten.

Infrastruktur

Sie besteht aus Folgendem:
– einer Grundlage für die Kommunikation (Sammlung) und Verarbeitung von Daten,
– einem sozio-technologischen Aspekt (die Infrastruktur muss verwaltet und organisiert werden),
– Hardware (Server, Kabel, Router) + Software (Protokolle, Bibliotheken, Frameworks, Algorithmen) + Geräte.

Dazu benötigen wir noch:
– einen zuverlässigen Zugang zu einem neutralen Internet,
– eine gemeinschaftlich gehaltene autonome Infrastruktur (Hardware und Software), mit der wir Datenanalyse betreiben können,
– eine Organisation, die die Analyse betreibt.

Protokolle und Dienstleistungen

Das sind unsere Forderungen:
– anonymer Zugang zum Internet,
– anonyme E-Mail-Dienste und verschlüsselte Kommunikation,
– transparente Algorithmen,
– öffentliche „Backdoors“.

Grundlagen:
– quelloffene Hardware,
– quelloffene Software,
– offene Formate.

Software

– Verschlüsselung;
– die Software sollte dem Nutzer ermöglichen, selbst darüber zu entscheiden, wem er seine Daten preisgibt (in Verbindung mit Verschlüsselung und dem dazugehörigen Schlüsselmanagement);
– Weiterbildung im Bereich digitale Sicherheit, Anonymität und Privatsphäre.

Datenzentren als Commons

DATENZENTREN ALS COMMONS

Wir möchten einmal ein Gedankenexperiment wagen: Was, wenn Big Data, die so viele Möglichkeiten bieten, aber auch in vielerlei Hinsicht eine Bedrohung darstellen, „kollektiv und öffentlich“ – also nicht durch Konzerne oder staatliche Stellen – verwaltet werden könnten und der „Öffentlichkeit oder Allgemeinheit“ gehören würden? Wie könnten solche ‚Datenzentren als Commons‘ aussehen? Wie könnten sie in die Realität umgesetzt werden?

Es ist hier wichtig zu definieren, was wir mit dem Begriff „öffentlich“ meinen, weil dieser Begriff in verschiedenen Kontexten eine unterschiedliche Bedeutung hat. Normalerweise verstehen wir unter „öffentlicher Hand“ eine Verwaltung „durch den Staat“. Das ist hier aber problematisch, weil wir gelernt haben, dass man dem Staat in Bezug auf persönliche Daten keinerlei Vertrauen entgegenbringen kann. Es steht schlicht zu befürchten, dass die Daten zur Überwachung und zur Förderung der Interessen von Konzernen genutzt werden (wobei betont werden muss, dass es in dieser Hinsicht wichtige Unterschiede zwischen den verschiedenen Staaten und Regierungen gibt).

Darüber hinaus glauben wir jedoch, dass es einen sehr wichtigen analytischen und politischen Unterschied zwischen dem Konzept der „öffentlichen Hand“ und dem Konzept der Commons gibt. Dazu gehört auch die Diskussion über den Charakter von „Rechten“, beispielsweise des „Rechts auf Privatsphäre“. Wenn wir von Rechten sprechen, stellen wir uns oft stillschweigend vor, dass es eine Autorität gibt, die diese Rechte durchsetzen und schützen kann oder soll. Meist stellen wir uns unter dieser Autorität konkret den Staat vor. Hier stellt sich jedoch das gleiche Problem: Können wir darauf vertrauen, dass der Staat unsere Rechte auch wirklich durchsetzt und schützt?

Eine der zentralen Fragen und Herausforderungen in dieser Hinsicht lautet: Wie können wir sicherstellen, dass es nicht wieder eine neue Verwaltungselite in diesem Bereich gibt? Welche Prinzipien von Wissenstransfer und Informationssicherung und -teilung können hier zum Einsatz kommen?

Eine weitere Herausforderung ist, dass die Dezentralisierung von Big Data in vielen kleinen Commons-Verwaltungseinheiten nicht automatisch verhindert, dass mit diesen Daten schädlich umgegangen wird oder sie von Dritten für Privatinteressen genutzt werden.

Direktiven

– Falls die Daten als Gemeineigentum verwaltet werden, muss sichergestellt werden, dass sie dort nur im Interesse der „Allgemeinheit“ oder „Öffentlichkeit“ nutzbar gemacht werden und dass keine persönlichen Freiheitsrechte verletzt werden. Dies bedeutet unter anderem:
– Es muss immer einen demokratischen und transparenten Entscheidungsfindungsprozess geben, wie im Einzelfall mit den Daten umgegangen wird.

– Es muss klare gesetzliche Regelungen geben, mit denen festgelegt wird, was eine zulässige Nutzung der „Daten“ darstellt und was nicht; an diesen Regelungen müssen sich auch die Debatten zur Entscheidungsfindung in den Commons-Verwaltungseinheiten orientieren.

– Die Mitglieder der Verwaltungseinheiten müssen gewählt werden. Wie das basisdemokratisch aussehen kann, zeigt unter anderem der Berliner Energietisch mit seiner Idee zur öffentlichen Verwaltung der Berliner Stadtwerke.

– Die konkrete Organisationsstruktur der Commons-Verwaltungseinheiten muss sich an der Idee orientieren, dass diejenigen, die die Daten im Internet generieren oder produzieren auch demokratisch darüber mit entscheiden können, wie diese genutzt werden. Dies würde die Form einer Art „ProduzentInnen-NutzerInnen-Demokratie“ auf der Ebene digitaler Daten annehmen.

Big Data-Aufklärung

BIG DATA-AUFKLÄRUNG

Eine grundlegende Fragestellung im Zusammenhang mit der Big Data-Commons betrifft Strategien zur Bildung und Aufklärung. Da das Thema uns alle angeht, stellt sich die Frage, wie wir verhindern können, dass das Thema „Big Data“ nicht nur von den Unternehmenseliten und den staatlichen Eliten diskutiert und verstanden wird. Wie können wir sicherstellen, dass alle Bürger die Auswirkungen verstehen und, falls nötig, auch Gegenmaßnahmen ergreifen können? Woraus könnten solche Maßnahmen bestehen? Und, zu guter Letzt, wie kann man das Thema so diskutieren, dass diese Diskussion eine breite Wirkung entfaltet? Welche öffentlichen Plätze und Medien sollten dazu genutzt werden?

Entmystifizierung des Status quo

– Datensaugen
– Industrielle „Datenviehhaltung“
– Dateneindringlinge
– Datenkolonisierung
– Digital Natives

Kampagnen

– Zusage einer Datenspende
– Register von Datenflüchtlingen
– Google-Mitarbeiter des Monats
– Datenflüchtlinge
– „Star Wars“ hacken
– „Data Vader“
– „Mach bei den Guten mit“
– „Data Master“
– „Luke Filewalker“

Das Datensaugen in unserer Hand! Oder: zurücksaugen!

– Data Mass Index (DMI),
– Big Data in unserer Hand in Echtzeit (App, die mir anzeigt, welche Daten von meinem Telefon gesaugt werden),
– wo sind die Daten, wo ist das Geld?

Verbraucherinformationssystem

– Ampelsystem für Daten (Bewertung)
– Stiftung Datentest
– Datenbetriebsanleitung
– Fairtrade-Daten

Offene Fragen

Die meisten dieser Ideen zielen in Richtung eines erweiterten individuellen Bewusstseins zu diesen Themen und bieten individuelle Lösungen an. Das ist zwar ein guter Anfang, jedoch fehlt noch der kollektive Aspekt des Themas. Zu einer Antwort auf die aktuelle Situation im Bereich „Big Data“ muss auch ein gemeinschaftlicher Ansatz gehören. Ansonsten wird die Lösung des Problems genau diejenigen individualistischen Muster reproduzieren, die Teil des Problems sind.

Herausforderungen

Es müssen eingängige Bilder und Erzählungen gefunden werden, die den „gemeinschaftlichen“ Aspekt des ganzen Projekts herausstellen.

Quellen

QUELLEN

Journalismus und Wissenschaft

* Tragedy of the Data Commons
von Jane Bambauer (geb. Jane Yakowitz), Harvard Journal of Law and Technology, Vol. 25, 2011.

* Sind Daten das Öl des 21. Jahrhunderts oder ein Gemeingut?
von Krystian Woznicki, Berliner Gazette, 2011.

* Big Data und Genmaterial sollten Gemeingüter sein
Sozialanthropologin Shalini Randeria plädiert für die Wiederentdeckung des Begriffs der Gemeingüter, die staatlichem und kommerziellem Zugriff entzogen sind. August 2015.

* Die Versuchungen von Big Data
von Jeanette Hofmann. In: Markus Beckedahl und Andre Meister (Hg.): Jahrbuch Netzpolitik 2012. Von A wie ACTA bis Z wie Zensur. Berlin: epubli, S. 74-79. 2012.

* Socialize the Data Centres!
von Evgeny Morozov. New Left Review 91, Januar/Februar 2015.

* Big data from the bottom up
von Nick Couldry and Alison Powell. Big Data & Society, 1 (2). ISSN 2053-9517, 2014.

* Data is not an asset, it’s a liability
von Marko Karppinen. Data is not an asset, it’s a liability. September 2015.

* Alternativen zu den kontrollierenden Konzernen.
von Ayad Al-Ani. Netzpiloten, February 2015.

* Big Data’s Radical Potential
von Pankaj Mehta. Big Data werden heute genutzt, um Profit zu machen oder die Bürger auszuspionieren. Doch was würde passieren, wenn die Daten für das Wohl aller eingesetzt würden? JacobinMag, März 2015.

* Daten als Wirtschaftsgut
von Herbert Zech. Überlegungen zu einem „Recht des Datenerzeugers“. Gibt es für Anwenderdaten ein eigenes Vermögensrecht bzw. ein übertragbares Ausschließlichkeitsrecht? CR, No. 3/2015.

* Controlling the future. Edward Snowden and the new era on Earth
von Elmar Altvater. Zuerst in deuscher Sprache erschienen in den „Blättern für deutsche und internationale Politik“ 4/2014.

* Engineering the public: Big data, surveillance and computational politics
von Zeynep Tufekci. First Monday, Vol. 19/7. Juli 2014.

* Die Politik der Daten
von Felix Stalder. Vortrag bei der Konferenz „Data Traces“, 3./4. Juli 2015. Enthält die Vortragsfolien in deuscher Sprache und eine Zusammenfassung des Inhalts in englischer Sprache. Juli 2015.

Politik

* International Surveillance: A New French Bill to Collect Data Worldwide!
Die Organisation „La Quadrature du Net“ stellt sich gegen einen neuen Gesetzentwurf in Frankreich, der die weltweite Sammlung von Daten vorsieht.

* EU-USA Rahmenabkommen zum Datenschutz
Das Rahmenabkommen zwischen den USA und der EU regelt den Umgang mit personenbezogenen Daten, die Ermittlungsbehörden untereinander austauschen, und es bietet EU-Bürgern die Möglichkeit, ihre Datenschutzrechte vor US-Gerichten einzuklagen.

* Heiko Maas: Geben Sie uns die Datenhoheit! #freeyourdata
Die Petition richtete sich an den Bundesminister der Justiz und für Verbraucherschutz Heiko Maas. Zitat: „Wir liefern das Öl des 21. Jahrhunderts frei Haus. Doch was ist mit uns?“

* Startups und Datenschutz
Anhörung im Ausschuss „Digitale Agenda“. „Open Data“ wird hier als brachliegende Ressource für Innovation stark gemacht. Die Sachverständigen Stephan Noller und Hermann Weiß sprachen von „Commons Data“.

* Datenschutz-Brief
Jährlicher Bericht, der aufzeigt, was ist mit unseren Daten gemacht worden ist. Transparenz ohne Folgen?

* Positionspapier zu Gemeingütern
Die Fraktion „Bündnis 90/Grüne“ hat 2013 ein Positionspapier zu Gemeingütern verabschiedet. Dabei ging es um viele Bereiche (auch Netz und Daten) und um die gesellschaftliche Dimension.

Werkzeuge

* Environmental Justice Atlas
Beeindruckende Nutzung von Daten, Karten und Open-source-Infrastruktur um die Verbindungen zwischen einzelnen Umweltschutzbewegungen weltweit darzustellen.

* Inside Airbnb
Das Projekt zeigt auf, wie Big Data von sozialen Bewegungen genutzt werden könnte. Die öffentlich zugänglichen Daten von AirBnB werden genutzt, um den Einfluss der Übernachtungsplattform auf Immobilienpreiserhöhungen darzustellen.

* Mailpile
Mailpile ist ein Webmail-Client mit eingebauter Verschlüsselung und Datenschutzfunktionen. Mailpile ist eine kostenlos Open-Source-Software.

* New Cloud Atlas
Der neue Cloud Atlas, zeigt die konkreten Orte der Datenwolke: Rechenzentren, Internetknotenpunkte, Kabel und Schalter.

* You Broke The Internet
Theorie und Praxis eines komplett verschlüsselten und verschleierten neuen Internets – für ein ein unbeschwertes digitales Leben.

* User Data Manifesto 2.0
Das Manifest definiert die Grundrechte aller Bürger in Bezug auf die Kontrolle ihrer Daten im Internetzeitaler.

Institutionen

* Council for Big Data, Ethics, and Society
Der Rat bringt Forscher verschiedener Disziplinen zusammen, um Initiativen rund um Big Data um kritische soziale sowie kulturelle Perspektiven zu bereichern.

* Max Planck Institute for Research on Collective Goods
Wichtige Forschungsfelder: Kartellrecht, Regulierung und die Stabilität der Finanzmärkte.

* Open Media Canada
Eine gemeinnützige Organisation, die sich für ein freies Internet einsetzt.

* P2P Foundation
Untersucht die Auswirkungen der Peer-to-Peer-Technologie und -Gedanken auf die Gesellschaft. Die Organisation will ein pluralistisches Netzwerk sein.

* Research Group: Ethics of Big Data
Das Ziel dieser interdisziplinären Forschungsgruppe ist die Entwicklung konkreter Ressourcen für Wissenschaftler, die Forschung auf der Grundlage von Big Data betreiben.

Credits

CREDITS

„Big Data in Our Hands. Re-Claiming the Oil of the 21st Century“ ist ein Langzeitprojekt der Berliner Gazette in Zusammenarbeit mit einer Vielzahl von Akteuren der Zivilgesellschaft.

Das Projekt startete im Herbst 2012 bei der Digital Backyards-Konferenz in Berlin und soll bis 2022 fortgeführt werden. Im Mittelpunkt des Projekts steht das „Commoning“ von Big Data. Ein wichtiger Meilenstein im bisherigen Arbeitsprozess war der Berliner Gazette-Workshop bei der UN|COMMONS-Konferenz, die vom 22. bis 24. Oktober 2015 in Berlin stattfand. Dieses Dokument ist das vorläufige Ergebnis des Vorhabens.

Die Kapitel „Big Data-Commons“ und „Datenzentren als Commons“ wurden in Vorbereitung auf die UN|COMMONS-Konferenz kollaborativ erstellt und boten einen zentralen Ausgangspunkt für die kreativen Prozesse innerhalb der Konferenz. Beispielsweise sind die Kapitel „Governance der Data Commons“, „Neue Daten-Infrastrukturen“ und „Big Data-Aufklärung“ daraus als Ergebnisse im Rahmen der Konferenz vor Ort hervorgegangen.

Die Berliner Gazette plant, das Projekt weiterzuführen und weiterzuentwickeln und dabei auch weiterhin eine Vielzahl von Akteuren der Zivilgesellschaft einzubeziehen. Daher wird das Weiterleiten und Teilen dieses Dokuments sehr begrüßt und auch Fragen und Anregungen – auch zum weiteren Vorgehen – werden gern aufgenommen. Bitte kontaktieren sie uns unter info(at)berlinergazette.de.

Bisher haben an diesem Projekt folgende Personen mitgewirkt: Bangi Abdul (tokyo-ritual.jp), Avantika Banerjee (wiredandnetworked.com), Zeljko Blace (Multimedia Institute), Sean Bonner (Safecast.org), Sophie Bloemen (commonsnetwork.eu), Benjamin Cadon (labomedia.org), Martin A. Ciesielski (Medienmosaik), Benjamin Diedrichsen (OPENMEDiAID), Christian Franz (cpc-analytics.com), Max Haiven (Nova Scotia College of Art and Design), Ted Han (Documentcloud.org), Harlo Holmes (New York Times), Hiroyuki Ito (Crypton Future Media), Joi Ito (MIT Media Lab), Ela Kagel (Supermarkt), Anna Magdalena Kedzierska (code4sa.org), Florian Kosak (berlinergazette.de), Tomislav Medak (mi2.hr), Annette Mühlberg (ver.di), Kazushi Mukaiyama (Future University Hakodate), Taketo Oguchi (shift.jp.org), Junichi Oguro (43d), Chris Piallat (berlinergazette.de), Nina Pohler (Hafen City Universität Hamburg), Alison Powell (London School of Economics), Michael Prinzinger (berlinergazette.de), Annika Richterich (Maastricht University), Jaron Rowan (Xnet), Andreas Schneider (Institute for Information Design Japan), Christopher Senf (berlinergazette.de), Lukas Stolz (European Alternatives), Mitsuhiro Takemura (Avec Lab), Keiko Tanaka (Kyoto College of Graduate Studies for Informatics), Edward Viesel (berlinergazette.de), André Wilkens (Analog ist das neue Bio).

Konzept, Projektkoordination und Redaktion: Magdalena Taube und Krystian Woznicki (berlinergazette.de)

Die Berliner Gazette ist eine gemeinnützige und überparteiliche Organisation, hinter der ein Team von JournalistInnen, ForscherInnen, KünstlerInnen und ProgrammiererInnen steht. Wir analysieren und erproben aufkommende kulturelle sowie politische Praktiken. Seit 1999 veröffentlichen wir berlinergazette.de unter einer Creative Commons-Lizenz – mit Beiträgen von mehr als 900 AutorInnen aus der ganzen Welt. Außerdem organisieren wir Konferenzen und geben Bücher heraus. Besuchen Sie Berliner Gazette hier.

Die Kapitelbilder stammen aus der Dokumentation verschiedener Berliner Gazette-Konferenzen, u.a. der UN|COMMONS-Konferenz in der Volksbühnne Berlin, der SLOW POLITICS-Konferenz im Supermarkt Berlin und der SLOW POLITICS-Konferenz bei Porto in Sapporo. Sie wurden von Norman Posselt, Andi Weiland und Krystian Woznicki aufgenommen. Alle Inhalte (Text, Bilder, etc.) stehen unter der Creative Commons-Lizenz CC BY NC SA.

Contents

Big Data Commons

Governance of the Data Commons

New Data Infrastructures

Commons Data Centers

Big Data Enlightenment

Sources

Credits

Inhalt

Big Data-Commons

Governance der Data Commons

Neue Daten-Infrastrukturen

Datenzentren als Commons

Big Data-Aufklärung

Quellen

Credits