1 Einführung

Studien zur politischen Willensbildung und Entscheidungsfindung in föderalen Systemen sind ein klassischer Forschungstopos der Politikwissenschaft, insbesondere in Deutschland. Dabei lässt sich der umfangreiche Forschungsstand zum föderalen System der Bundesrepublik in zwei große Strömungen einteilen. Ein erster Literaturstrang beschäftigt sich mit den Beziehungen zwischen Bund und Ländern sowie der Koordination zwischen den Ländern im verbundföderalistischen System der Bundesrepublik. Hierbei stehen insbesondere Fragen der Politikverflechtung (Scharpf et al. 1976; Scharpf 1985), der mangelnden Passung von Parteienwettbewerb und Verhandlungszwang (Lehmbruch 1976) sowie Dynamiken der Kooperation zwischen den Akteuren (Benz 1985; Kropp 2010; Hegele und Behnke 2013) und (De)Zentralisierungstendenzen (Kaiser und Vogel 2017) im Zentrum der Analyse (zur internationalen Literatur, siehe Bolleyer 2014). Ein zweiter Literaturstrang nimmt die Länderebene vergleichend in den Blick und untersucht Gemeinsamkeiten und Unterschiede der Politik der Bundesländer. Diese Arbeiten richten ihr Interesse u. a. auf Parteien und Parteiensysteme der Länder (Jun et al. 2008; Bräuninger und Debus 2012; Bräuninger et al. 2020), Landtagswahlen und -wahlkämpfe (Völkl et al. 2008; Rauh 2016), Aussagen zu und Formierung von Koalitionen auf Landesebene (Spier 2013; Best 2015; Baumann et al. 2017) sowie institutionelle Unterschiede zwischen den politischen Systemen der Länder (Leunig 2007; Freitag und Vatter 2008). Zudem lässt sich feststellen, dass die Forschungsaktivitäten zur Varianz zwischen den deutschen Ländern mit Blick auf Politikinhalte (Schmidt 1980; Hildebrandt und Wolf 2008, 2016; Wagschal und Wenzelburger 2009; Hörisch und Wurster 2017, 2019) sowie Politikergebnisse im Sinne von Outputs und Outcomes (Wurster 2017; Wurster und Hagemann 2018, 2019) deutlich zugenommen haben (siehe insbesondere auch die beiden Aufsatzsammlungen von Jeffery et al. 2016; und Sack und Töller 2018).

Wir widmen uns im vorliegenden Literaturbericht zuvorderst letzterer Perspektive und blicken auf die vergleichende Bundesländerforschung – wenngleich föderale Dynamiken selbstverständlich immer eine Rolle spielen. Vergleicht man hier den Stand der Forschung insbesondere mit neueren US-amerikanischen Debatten, so zeigt sich, dass sich diese in den letzten Jahren verstärkt den ‚großen Fragen‘ zu Repräsentation oder Responsivität (etwa Lax und Phillips 2012; Pacheco 2013) zugewandt haben, während für Deutschland dazu bisher kaum systematisch-empirische Forschungen vorliegen. Dabei ist etwa die Frage, ob „der demokratische Prozess die Regierung dazu bewegt, diejenige Politik zu machen und zu implementieren, welche die Bürger*innen wollen“ (Powell 2004, S. 91; eigene Übersetzung) und sich damit responsiv zu zeigen, auch auf Länderebene von zentraler demokratietheoretischer und -praktischer Bedeutung. Angesichts dieser Forschungslücke stellen wir in diesem Literaturbericht die folgenden drei Fragen: Erstens, welche Resultate hat die bisherige Forschung in Bezug auf einzelne Aspekte von Repräsentation und Responsivität hervorgebracht? Zweitens, welche Schlussfolgerungen ergeben sich hieraus mit Blick auf Responsivität im deutschen Ländervergleich? Und drittens, wie könnte eine Forschungsagenda aussehen, die zentrale Leerstellen adressiert?

Der Beitrag gliedert sich wie folgt: In Abschnitt 2 stellen wir zunächst die Kette der Responsivität auf theoretischer Ebene vor, bevor Abschnitt 3 einen Überblick zum Forschungsstand in Bezug auf die einzelnen Elemente dieser Kette im deutschen Föderalstaat gibt. In Abschnitt 4 skizzieren wir schließlich ein zukünftiges Forschungsprogramm, welches Aspekte von Responsivität in den deutschen Bundesländern (noch) stärker als bisher in den Blick nimmt.

2 Die Kette der Responsivität

Ob und gegebenenfalls wie sich die Präferenzen einzelner Bürger*innen in tatsächlichen Politikinhalten wiederspiegeln, ist eine alte politikwissenschaftliche Frage. Sie fußt auf Analysen zur Repräsentation (Przeworski et al. 1999), die vor allem in der US-amerikanischen Politikwissenschaft eine lange Tradition aufweisen (Miller und Stokes 1963; Pitkin 1967; Page und Shapiro 1983). Aufbauend auf der Studie von Powell (2004), lässt sich dabei eine demokratische Kette der Responsivität (chain of responsiveness) konzipieren, die der Theorie nach die Präferenzen der Wählerschaft (Input) über die Agendasetzung in Regierungspolitik (Throughput) und somit in Outputs und Outcomes übersetzt (opinion-policy-linkage; ähnlich auch Esaiasson und Wlezien 2017). Dabei besteht der größte Unterschied zwischen den ursprünglichen Überlegungen von Powell und unseren folgenden Ausführungen in der expliziten Modellierung von politischen Parteien, und deren Partei- und Wahlprogrammen, als Transmissionsriemen – was angesichts der zentralen Rolle politischer Parteien im deutschen System sinnvoll erscheint (dazu auch: Dalton et al. 2011). Entsprechend der Annahmen des thermostatic models (Soroka und Wlezien 2010) sollte darüber hinaus eine Feedback-Schleife bestehen, welche idealiter die Regierungsperformanz (Outputs und Outcomes) rückbindet an die Forderungen und Präferenzen der Bürger*innen.

Angesichts der umfangreichen international-vergleichenden Forschungsaktivität ist es überraschend, dass die Frage nach der opinion-policy-linkage und ihrem Zustandekommen auf subnationaler Ebene nur selten untersucht wird – zumal Gliedstaaten erhebliche Kompetenzen in zahlreichen Politikfeldern besitzen. Erst in den letzten Jahren sind Studien zu den US-Einzelstaaten entstanden, die zeigen, dass – unter bestimmten Bedingungen – Formen von dynamischer Responsivität sowie von Kongruenz feststellbar sind (Lax und Phillips 2012; Pacheco 2013; Caughey und Warshaw 2017; Simonovits et al. 2019). Für die subnationale Ebene in Deutschland fehlen solche Analysen, die das Zusammenspiel von Bürgerpräferenzen und politischen Willensbildungs- und Entscheidungsfindungsprozess systematisch und umfassend in den Blick nehmen, dagegen weitgehend. Vor diesem Hintergrund gibt der nächste Abschnitt einen Überblick über die vorhandenen empirischen Befunde zu einzelnen Elementen der Responsivitätskette in den deutschen Ländern und zeigt bestehende Leerstellen auf.

3 Forschungsstand und bestehende Desiderata

3.1 Präferenzen der Wählerschaft und Agendasetzung auf Landesebene

Die Präferenzen der Wählerschaft und die Problemdefinition stehen am Anfang des politischen Prozesses und sind maßgeblich dafür, ob ein bestimmtes Thema überhaupt als ein politisches Problem angesehen wird und damit die Möglichkeit erhält, auf die Regierungsagenda zu gelangen (Kingdon 1984, S. 23–27; Jones 1994). Powell (2004, S. 92) beschreibt diesen Prozess auch als „structuring choices“. Wann ein Thema in der Öffentlichkeit Aufmerksamkeit erreicht und zu einem politischen Problem wird, hängt dabei von vielen unterschiedlichen Faktoren ab, z. B. vom Verhalten politischer und gesellschaftlicher Akteure, von spezifischen Ereignissen oder der medialen Aufmerksamkeit. Für die deutschen Länder wurden die landesspezifischen Einflussfaktoren der Problemdefinition bisher kaum analysiert. Dabei ist durchaus zu vermuten, dass spezifische Elemente der Problemdefinition auf Landesebene insbesondere dann eine Rolle spielen, wenn die Problemlösung in die Kompetenzbereiche der Landesregierungen fallen (z. B. bei der Bildungspolitik) oder wenn das Thema einen starken regionalen Bezug hat. Dafür spricht etwa die Medienanalyse von Tenscher und Schmid (2009, S. 69–70), die für drei ausgewählte Landtagswahlen zeigt, dass regionale Medien überproportional diejenigen Fragen thematisieren, welche die Kompetenzen der Länder betreffen. Im Gegensatz dazu erwartet von Blumenthal (2010, S. 191), dass bereits bei der Problemdefinition „angesichts einer weitgehend bundesweit orientierten politischen Öffentlichkeit möglicherweise die Weichen für eine einheitliche Herangehensweise gestellt“ werden.

Einen weiteren Ansatzpunkt in diesem Zusammenhang bilden Studien zu sogenannten Nebenwahlen (second-order elections) in föderalen Systemen (Müller und Debus 2012). Diese Arbeiten geben Hinweise darauf, ob bundespolitische oder landespolitische Themen bei einer Wahl besonders relevant sind. Hier finden etwa Krumpal und Rauhut (2006, S. 12), dass insbesondere westdeutsche Wähler*innen die Landespolitik bei Landtagswahlen als wichtiger für ihre Wahlentscheidung erachten als die Bundespolitik. Völkls (2008, S. 163) Untersuchung verdeutlicht darüber hinaus, dass Wähler*innen durchaus zwischen Landes- und Bundesthemen unterscheiden können. Allerdings spielen auch allgemeine Sachfragen, wie etwa die Arbeitslosenquote, für Landtagswahlen eine wichtige Rolle, sodass sowohl Verdrängungseffekte als auch Kontaminationen sowie eine gegenseitige Beeinflussung von Themenwichtigkeiten zu erwarten sind. Zu ähnlichen Ergebnissen kommen Untersuchungen in anderen Föderalstaaten. So zeigen etwa die Ergebnisse von Cabeza (2018) zu spanischen Regionalwahlen, dass Wähler*innen abhängig vom Kontext (z. B. wirtschaftliche Situation) eher regionale oder eher nationale Themen als wichtig für ihre Wahlentscheidung erachten.

Die meisten empirischen Studien zur Responsivität nutzen Daten zu themenspezifischen Einstellungen der Bürger*innen – etwa die Frage, welche Issues sie für wichtig erachten –, um die öffentliche Agenda zu definieren (dazu kritisch Wlezien 2016). Angesichts der zentralen Rolle von Präferenzen als Ausgangs- und Endpunkt der Kette der Responsivität sind Informationen zu den Präferenzen daher von großer Bedeutung. Abgesehen von einzelnen, allerdings nur in großen zeitlichen Abständen stattfindenden Landtagswahlstudien, fehlen auf Bundesländereben Analysen, welche die Dynamiken einzelner Themenkomplexe über längere Zeiträume hinweg präzise darstellen. Bisher konnten nur zu einzelnen besonders bedeutsamen Themenkomplexen, wie beispielsweis der Flüchtlingskrise im Jahr 2016 (Debus 2017; Kortmann und Stecker 2019), entsprechende Analysen durchgeführt werden.

Über spezifische Einstellungen hinaus hat auch das politische Wissen der Wähler*innen einen Einfluss auf die Agendasetzung auf Landesebene. Können Bürger*innen nämlich tatsächlich bewerten, dass ihre Landesregierung bestimmte Kompetenzen besitzt und demnach für gewisse Politiken verantwortlich ist, erhöht sich die Chance, dass dieses Thema potentiell als ein landespolitisches Problem definiert wird. Entsprechend wirkt politisches Wissen auch Strategien der Schuldvermeidung (blame avoidance) entgegen, wenn Landesregierungen für schlechte Performanz auf die Bundesebene verweisen (Cabeza et al. 2016; Stecker 2015). Inwiefern solches Wissen bei Bürger*innen auf Landesebene vorhanden ist, wurde bisher jedoch empirisch nur sehr eingeschränkt untersucht (ein internationaler Vergleich mit zwei deutschen Ländern findet sich bei Golder et al. 2017, S. 119–124).

3.2 Politikformulierung durch Parteien auf Landesebene

Wenn ein Thema als politisches Problem definiert und auf die öffentliche Agenda gelangt ist, besteht der nächste Schritt in seiner Übersetzung in politische Programme und über Wahlen sowie mittels Regierungsbeteiligung politischer Parteien in Public Policies. In den vergangenen Jahrzehnten wurden enorme Fortschritte in der Vermessung dieser Übersetzungsleistung durch politische Parteien erzielt. So ist es zum Beispiel möglich, über die Daten des Comparative Manifesto Projects die Betonung einzelner Themen in Parteiprogrammen für eine große Zahl von Parteien über Zeit nachzuvollziehen (Volkens et al. 2018). Alternativ wurde über Expertenbefragungen erhoben, welche Themen von politischen Parteien als wichtig erachtet werden (Laver und Hunt 1992; Benoit und Laver 2006; Polk et al. 2017). Schließlich ist es möglich, die Positionierung von Parteien und die Betonung bestimmter Themen mittels textanalytischer Verfahren zu erheben und somit nicht nur Dynamiken des Parteienwettbewerbs nachzuzeichnen (Adams et al. 2005), sondern auch zu überprüfen, ob und in welchem Ausmaß Parteien tatsächlich das auf Basis ihrer Programme erhaltene Wählermandat in politische Outputs überführen (Klingemann et al. 1994; Budge 2015). Für diese policy-to-program linkages spricht u. a. das Vorliegen eines empirischen Zusammenhangs zwischen der Betonung bestimmter Themen im Wahlprogramm und politischen Outputs (siehe etwa Wenzelburger et al. 2019).

Trotz der vergleichsweise hohen und innovativen Forschungstätigkeit in Bezug auf die Analyse von Parteiprogrammen und deren Einfluss auf Policies (u. a. Bräuninger und Debus 2012; Bräuninger et al. 2020; Wenzelburger 2013; Bräuninger und Giger 2016; Hörisch und Wurster 2017; Bräuninger et al. 2019) besteht auf Länderebene eine Forschungslücke bei der themenspezifischen Positionierung der Landesparteien. Im Gegensatz zu einigen anderen europäischen Staaten, in denen die Programme der regionalen Parteien im Rahmen des Regional Manifesto Project erfasst wurden (Alonso et al. 2013), ist für Deutschland bis dato nicht erhoben worden, welche thematischen Schwerpunkte Parteien in ihren Landtagswahlprogrammen setzen und mit welchen konkreten Politiken sie sich den Wählern präsentieren. Zwar haben immer wieder einzelne Forscher versucht, mittels textanalytischer Verfahren eine themenspezifische Vermessung der Parteipositionen zu erreichen (Seher und Pappi 2011; Bräuninger und Debus 2012; Bräuninger et al. 2020; Ewert et al. 2018). Dennoch gibt es immer noch viele Lücken in Bezug auf eine übergreifende und in sich systematische Aufbereitung des Politikangebots von Parteien auf Landesebene. Mit Blick auf die Analyse von Responsivität ist diese Leerstelle jedoch problematisch, weil theoretisch von Issue-spezifischer Responsivität ausgegangen wird. Zwar ist es prinzipiell möglich, die Reaktion von Parteien auf Wählerpräferenzen auch auf aggregiertem Niveau (z. B. auf einer übergreifenden Links-Rechts-Dimension) zu analysieren (Bräuninger und Debus 2012, S. 187–201). Allerdings bleiben hier die eigentlichen Dynamiken auf der Ebene der Sachthemen im Dunkeln, wobei gerade diese Responsivität bei Sachfragen zumindest auf Ebene der Nationalstaaten relevant zu sein scheint.

Wie für die Agendasetzung gilt im Übrigen auch für die Politikformulierung von Parteien auf Landesebene, dass diese nicht isoliert von der Bundespolitik betrachtet werden kann. Dies betrifft sowohl die Frage, welche Themen in Parteiprogrammen stärker oder weniger stark betont werden, als auch die in den Landtagswahlprogrammen formulierten Politiken. Denn der Forschungsstand zu den Inhalten regionaler Parteiprogramme zeigt, dass Parteien nicht nur diejenigen Policies in ihren Programmen aufnehmen, welche tatsächlich auf Landesebene entschieden werden können, sondern strategisch absichtsvoll auch nationale Themen in Wahlprogrammen betonen (Alonso et al. 2013; Cabeza et al. 2016; Golder et al. 2017). Diese Mischungsverhältnisse wurden bisher vor allem im Kontext des Regional Manifestos Project für Spanien und Großbritannien untersucht. Auch für Deutschland zeigen Analysen, dass Landesparteien ihre Positionen sowohl in Abhängigkeit von der allgemeinen Parteilinie als auch in Bezug auf regionale Elektorate verändern (Müller 2013). Daneben findet Stecker (2015), dass Landesparteien sich im Parteienwettbewerb strategisch zwischen bundespolitischen und landespolitischen Themen positionieren. Zudem weist eine explorative Auswertung auf lokaler Ebene im Zuge des Local Manifesto Projects darauf hin, dass die Betonung nationaler Themen in den Programmen von Parteien in großen deutschen Städten durchaus variiert (Gross und Jankowski 2019). Schließlich finden qualitative Untersuchungen zu einzelnen Wahlen und Wahlkämpfen ebenfalls jeweils spezifische Mischungsverhältnisse von bundes- und landespolitischen Themen (siehe etwa die Beiträge in Tenscher und Rußmann 2016).

3.3 Politische Outputs und Outcomes auf Landesebene

Eine Untersuchung der Responsivitätskette ist ohne den Einbezug von politischen Entscheidungsprozessen (decision-making) und deren konkreter Ergebnisse in Form von Policy-Outputs/-Outcomes unvollständig. Vergleichende Studien zum Policy-Output haben dabei in der Vergangenheit vor allem auf finanzielle Messgrößen (Staatsfinanzen) und Gesetzgebungsindikatoren zurückgegriffen. Staatsausgaben finden insbesondere in der Forschungsrichtung zum thermostatic model ihre Anwendung (Wlezien und Soroka 2012; Soroka und Wlezien 2015), wobei in der Regel deren Entwicklung mit den Veränderungen der öffentlichen Meinung abgeglichen wird. Angesichts der Kritik gegenüber Staatsausgaben als angemessenem Proxy für die Staatstätigkeit (Green-Pedersen 2004; Clasen und Siegel 2007), wurde in den vergangenen Jahren vermehrt die Gesetzgebung als direktester Policy-Output erfasst. Hierbei sind eine Reihe an Projekten entstanden, wie etwa das Comparative Policy Agendas Project (Baumgartner und Jones 1991; Baumgartner et al. 2006), das Consensus-Project (Bauer und Knill 2014) oder Arbeiten zu einzelnen Politikfeldern (Jensen und Wenzelburger 2020; Wenzelburger 2020). Dabei wurde die Kongruenz zwischen Präferenzen der Bevölkerung einerseits und der Gesetzgebung andererseits bislang auf dreierlei Weisen untersucht: Erstens liegen Arbeiten vor, die betrachten, ob das Abstimmungsverhalten einzelner Abgeordneter mit der Meinung der Wähler*innen im Wahlkreis korrespondiert (Miller und Stokes 1963; Achen 1978; Arnold 1990). Zweitens konnte mittels Daten des Comparative Policy Agenda Project zur themenspezifischen Gesetzgebung auf nationaler Ebene gezeigt werden, dass Verschiebungen in der öffentlichen Meinung durchaus Gesetzgebungsprozesse beeinflussen können (Jones und Baumgartner 2004; Froio et al. 2017). Drittens besteht die Möglichkeit, Responsivität auch breiter zu definieren und bereits die Befassung mit den Themen durch das Parlament als responsives Verhalten zu werten. Diese Strategie nutzt etwa Brettschneider (1995) in seiner wegweisenden Studie zu Deutschland.

Auf subnationaler Ebene wurde die Frage nach der Responsivität von Regierungen gegenüber den Präferenzen ihrer Bürger*innen bislang fast ausschließlich unter Rückgriff auf Daten für die US-Einzelstaaten untersucht – wobei hier neben Studien, die Staatsausgaben als abhängige Variable zur Messung der Policies verwenden (Pacheco 2013), auch Kodierungen gesetzgeberischer Outputs vorgenommen wurden (Lax und Phillips 2012). Für die deutschen Länder hingegen liegen weder Untersuchungen zur Responsivität vor, noch wurde die Gesetzgebung der Länder bisher themenspezifisch kodiert. Stattdessen nutzen die meisten Policy-Analysen im Bundesländervergleich – in der Tradition der Pionierstudie von Schmidt (1980) – politikfeldspezifische Staatsausgaben (Wolf 2006; Hildebrandt 2009; Stocker 2010; Tepe und Vanhuysse 2014; Ewert et al. 2018) oder Personalstärken (z. B. Zahl der Lehrer oder Polizisten bei Tepe und Vanhuysse 2009, 2013) als abhängige Variable und streifen dabei die Frage der Responsivität allenfalls implizit, etwa bei der Untersuchung von strategischem Timing anhand von Wahlzyklen (Galli und Rossi 2002; Schneider 2009).

Anders verhält es sich mit Blick auf die vertikale Ebene, also hinsichtich der Frage nach der Beeinflussung von Entscheidungsfindung auf Länderebene durch den Bund. Hierzu besteht ein erheblicher Forschungsstand. Ein zentrales Thema ist dabei das Zusammenspiel zwischen Bund und Ländern im deutschen Föderalismus, wobei die These der Blockade effizienter Entscheidungsfindung im kooperativen Föderalismus der Bundesrepublik dominiert (Scharpf et al. 1976; Scharpf 1985; Lehmbruch 1976). Dabei entwickelte sich ein sehr ertragreicher Forschungsstrang, der sich insbesondere mit der Verflechtung von Entscheidungsfindungsprozessen zwischen Bund und Ländern und den daraus resultierenden Anpassungsproblemen an neue politische Herausforderungen beschäftigt (Benz und Lehmbruch 2002; Kropp 2010; Von Blumenthal und Bröchler 2010; Behnke und Kropp 2016).

Bei aller Ergiebigkeit dieser Forschungen fehlt jedoch bislang eine empirische Basis, mittels derer über eine systematische Erfassung der Gesetzgebung auf Länderebene, die Veränderungen von Politikverflechtung über Zeit quantifiziert und damit auch der Einfluss der Bundesebene analysiert werden könnte (aber mit Blick auf (De-)zentralisierungsdynamiken: Kaiser und Vogel 2017). Zwar haben mehrere Analysen zur Föderalismusreform I versucht, die Wirkungen der Reform zum Beispiel mit Blick auf die Zustimmungspflichtigkeit von Bundesgesetzen (Zohlnhöfer 2009; Stecker 2016) oder in Bezug auf die veränderten Kompetenzen der Länder (Stecker 2016; Reus und Vogel 2018) zu vermessen. Allerdings liegen für manche Bereiche (z. B. Abweichungsgesetzgebung) bisher keine systematischen Ergebnisse vor. Zudem leidet die bisherige Forschung darunter, dass eine längere Zeitreihe zur Gesetzgebungsaktivität in den Ländern in spezifischen Politikfeldern fehlt. Diese wäre jedoch notwendig, um unabhängig von den Wirkungen der jüngsten Großreform den Einfluss der Bundesebene zu analysieren. Denn die jahrzehntelange Forschung zu Zentralisierungs- und Dezentralisierungsdynamiken im deutschen Föderalstaat (Benz 1985; Biela et al. 2013; Kaiser und Vogel 2017) hat durchaus gezeigt, dass es dem Bund auch außerhalb großer Reformereignisse gelingt, zunehmend Einfluss auf die Landesgesetzgebung zu nehmen (siehe für einen Überblick Sturm 2016).

Aufgrund der fehlenden Datenbasis können die Erkenntnisse aus den vielfältigen Fallstudien bis dato noch nicht auf breiterer Basis abgesichert werden. Dieser Mangel an systematischen Daten zur Gesetzgebung erklärt auch, warum bisher nicht untersucht wurde, inwieweit die Kette der Responsivität nach Bund- und Landesebene spezifiziert werden kann. Für die Entwicklung von Sozialausgaben in den kanadischen Provinzen finden zum Beispiel Wlezien und Soroka (2011), dass die föderale Struktur Policy-Feedback massiv behindert und dadurch Responsivität im Sinne des thermostatic model auf nationaler Ebene eingeschränkt wird. Ein Grund hierfür liegt schlicht in der Verflechtung von Bund und Provinzen, die eine klare Zuschreibung von Verantwortung erschwert. Wenn solche Verflechtungen oder „Kontaminationen“ (Gschwend 2008) von politischen Prozessen stattfinden, hat dies direkte Auswirkungen auf die Kette der Responsivität, da zum Beispiel die Zuordnung von Verantwortlichkeit oder Regierungsperformanz verwischt wird (siehe auch Däubler et al. 2018).

Die reale Performanzwirkung politischen Handels (Policy-Outcomes) hängt dann von vielen Faktoren ab, die eine Landesregierung, trotz vielfältiger finanzieller und regulatorischer Instrumente nur teilweise beeinflussen kann, die ihr grundsätzlich zur Verfügung stehen. Neben dem Wollen spielt somit das Können einer Landesregierung im Hinblick auf die Umsetzung und Implementation getroffener Politikentscheidungen eine maßgebliche Rolle. Da ein responsiver Feedback-Zyklus idealiter nicht nur zwischen Policy-Outputs und Bürgerpräferenzen, sondern auch im Hinblick auf tatsächliche Policy-Outcomes bestehen sollte, kommt Studien wie der von Simonovits et al. (2019), die einen Zusammenhang zwischen ökonomischen Performanzindikatoren auf subnationaler Ebene und Wahlverhalten identifizieren können, eine große Bedeutung zu. Dabei kann allerdings auch eine große Diskrepanz zwischen tatsächlicher und von den Bürgern wahrgenommener Performanz bestehen.

Insgesamt lassen sich in den wenigen bisher vorhandenen Arbeiten zu Policy-Outcomes auf der Bundesländerebene relativ eindeutige Parteiendifferenzeffekte identifizieren (etwa Wurster und Hagemann 2018). Allerdings weist die Forschung hier auch auf zahlreiche weitere, zum Teil intervenierende oder Parteieneffekte verwischende ökonomische wie auch gesellschaftliche Einflussfaktoren hin. Responsive Politikgestaltung von Landesregierungen ihren Wählern gegenüber, stellt dabei, gerade auch wegen der Einflüsse des Mehrebenensystems, eine große Herausforderung dar. Trotz erheblicher methodischer Fallstricke ist die vergleichende Analyse der Policy-Outcomes für die Frage der Responsivität auf Bundesländereben allerdings ein weiterer entscheidender Baustein, da sie gleichsam den Endpunkt im politischen Prozess abbildet, und nur durch ihre Erfassung die gesamte Responsivitätskette samt etwaiger Feedbackschleife hinweg zu evaluieren ist.

4 Skizze eines zukünftigen Forschungsprogramms

Die Diskussion im vergangenen Abschnitt hat gezeigt, dass durchaus ein beeindruckender Forschungsstand zur Politik auf Bundesländerebene existiert. Gleichzeitig ist aber auch deutlich geworden, dass gerade aus der Perspektive der international-vergleichenden Forschung in wesentlichen Bereichen noch erhebliche Lücken bestehen, die es zu adressieren gilt, um eine Responsivitätskette auf Ebene der Bundesländer vollständig erfassen zu können. Wie könnte folglich ein zukünftiges Forschungsprogramm mit Blick auf die vergleichende Analyse von Politik und Policies auf Länderebene aussehen? Vor dem Hintergrund der vorangegangenen Erarbeitung des Forschungsstands sind unserer Ansicht nach vier ineinandergreifende Aspekte für eine Forschungsagenda besonders vielversprechend:

Erstens ist eine tiefergehende Auseinandersetzung mit einzelnen Elementen der Responsivitätskette mit Blick auf die Bundesländer notwendig, da hier teilweise noch (große) Lücken klaffen. So fehlen bisher etwa fundierte empirische Erkenntnisse nahezu vollständig, die es uns erlauben würden, gesicherte Aussagen über Prozesse der Problemdefinition auf Landesebene nachzuzeichnen. Für die Phase des Agenda-Settings und die Politikformulierung ist die Literaturlage zwar besser, weil die Programmatik der Landesparteien und deren Positionierung bereits vermessen wurden. Allerdings besteht noch erheblicher Forschungsbedarf bei der themenspezifischen Priorisierung sowie der Formulierung von spezifischen Politiken. Damit verbleibt die Untersuchung der Agendasetzung auf Ebene der Länder auf einem relativ hoch aggregierten Niveau und lässt direkte Rückschlüsse, inwiefern Parteien wichtige Themen der Bürger*innen in ihren Programmen adressieren, nicht zu. Für die Regierungspolitik und Politikimplementation kann wiederum festgehalten werden, dass es hier zwar eine große und wachsende Zahl von Studien zur Bund-Länder-Koordination oder zum Regierungshandeln in einzelnen Politikfeldern gibt, diese aber in der Regel keine systematisch-vergleichenden Einsichten über die Aktivität, Bilanz sowie Performanz von Regierungen auf Länderebene ermöglichen.

Zweitens fehlt eine systematische Betrachtung der Feedbackschleifen sowie der Rückkopplung der Ergebnisse in Bezug auf alle Elemente der Responsivitätskette. Neben der genaueren Betrachtung der Feedbackmechanismen als gesondertem Untersuchungsgegenstand erscheint es notwendig, im Sinne einer engeren Verschränkung der Kettenglieder, Feedbackelemente mit Blick auf alle Schritte der Responsivitätskette systematisch mitzudenken. So sind Feedbackelemente wie etwa Gesetze, die auf wahrgenommene Probleme zurückwirken, ebenso ein zentraler Bestandteil der Responsivitätskette wie die Wahrnehmung von Policy-Outcomes. Ohne ausreichende und systematisch erhobene empirische Daten beispielsweise darüber, welche Probleme in den Ländern als relevant betrachtet werden, lassen sich Aussagen über Rückwirkungseffekte von Gesetzen oder Policy-Outcomes allerdings nicht treffen.

Anknüpfend daran sollte die zukünftige Forschung drittens verstärkt die systematisch-empirische Analyse der Verbindungen zwischen den einzelnen Elementen in den Fokus ihrer Beschäftigung rücken und damit über die Fokussierung auf einzelne Elemente der Responsivitätskette hinauszielen. Stand heute liegen etwa nur wenige Erkenntnisse darüber vor, wie Einstellungen von Bürger*innen in den Ländern auf die Problemdefinition wirken oder welche Rolle andere bekannte Faktoren wie etwa fokussierende Ereignisse spielen. Darüber hinaus wissen wir nichts darüber, wie die Problemdefinition Motive und Zielsetzungen von Landesparteien bei der Formulierung von Wahlprogrammen beeinflusst. Auch tappen wir weitgehend im Dunkeln, wenn es um die Frage geht, wie identifizierte Probleme mittels Parteien als zentralen Transmissionsriemen in spezifische Politikpositionen und letztlich in Regierungshandeln übersetzt werden. Dabei wiegen die Forschungslücken in Bezug auf die einzelnen vorausliegenden Kettenglieder sowie die fehlende Analyse der Verknüpfungen der einzelnen Elemente besonders schwer für die systematische Untersuchung der Politikimplementation und Regierungsperformanz, die am Ende der Responsivitätskette steht bzw. im Sinne der Feedbackschleife wiederum auch ihren Anfang bildet. Wenn etwa unterschiedliche Gesetzgebung der Landesregierungen responsiv auf die Präferenzen der Wähler in den jeweiligen Bundesländern reagiert, dabei jedoch zu Divergenzen führt, stellt sich aus theoretischer Sicht die Frage, wie solche Entwicklungen föderalismustheoretisch und im Spannungsfeld von Einheit und Vielfalt im Bundesstaat zu interpretieren sind. Dabei gilt diese Problematik nicht nur für Analysen von Gesetzgebung und Performanz, sondern ist auch auf politische Einstellungen und Feedback übertragbar. Zwar lässt sich diese Frage je nach normativem föderalismustheoretischem Standpunkt unterschiedlich beantworten, mangels Daten zu den Ursachen unterschiedlicher Policy-Profile in den Ländern ist eine empirisch fundierte Diskussion solcher Zusammenhänge bisher jedoch kaum möglich.

Dies leitet über zum vierten zentralen Desiderat eines zukünftigen Forschungsprograms, nämlich der Schaffung einer einheitlichen empirischen Datengrundlage, welche umfassende(re) Analysen der Responsivitätskette – ihrer Einzelelemente sowie Verbindungen – als bisher ermöglicht. So ist ein wesentlicher Grund für viele der zuvor identifizierten Lücken darin zu suchen, dass eine empirische Untersuchung des gesamten Politikprozesses aufgrund mangelnder adäquater Daten bis dato schlichtweg nicht erfolgen konnte. Vor diesem Hintergrund sollte ein Ziel weiterer Forschungsaktivtäten sein, die Erhebung, Systematisierung und Bereitstellung von Daten auf Ebene der Bundesländer auszuweiten, beispielsweise zu den politischen Einstellungen der Bürger*innen in den Ländern, zur Themenaufmerksamkeit innerhalb der Bevölkerung, in regionalen Medien sowie in Parteiprogrammen, zu konkreten Politikpositionen von Parteien in Wahlprogrammen und Koalitionsverträgen, bis hin zur Parlaments- und Regierungspraxis sowie Performanzindikatoren.

Die in den vorausgegangenen Abschnitten aufgeworfenen Fragen zur Responsivitätskette sind insgesamt zu wichtig – sowohl mit Blick auf die Föderalismusforschung als auch mit Blick auf weitere demokratietheoretische Fragestellungen – um eine mögliche Varianz der Responsivität zwischen den Ländern, zwischen Politikfeldern sowie über Zeit nicht tiefergehend zu untersuchen. Daher stellt die systematische Aufarbeitung und empirische Analyse der skizzierten Responsivitätskette samt etwaiger Feedbackprozesse im Vergleich der deutschen Länder eine zentrale Forschungslücke dar, welche in Zukunft stärker adressiert werden sollte.