Faltung (Mathematik)
In der Funktionalanalysis, einem Teilbereich der Mathematik, beschreibt die Faltung, auch Konvolution (von lateinisch convolvere „zusammenrollen“), einen mathematischen Operator, der für zwei Funktionen und eine dritte Funktion liefert.
Anschaulich bedeutet die Faltung , dass jeder Wert von durch das mit gewichtete Mittel der ihn umgebenden Werte ersetzt wird. Genauer wird für den Mittelwert der Funktionswert mit gewichtet. Die resultierende „Überlagerung“ zwischen und gespiegelten und verschobenen Versionen von (man spricht auch von einer „Verschmierung“ von ) kann z. B. verwendet werden, um einen gleitenden Durchschnitt zu bilden.
Die Kreuzkorrelations-Operation ist identisch mit der komplex konjugierten Faltung (s. hier). Insbesondere im Fachgebiet Maschinelles Lernen, wo man mit Convolutional Neural Networks arbeitet, wird aufgrund dieser Identität meistens die Kreuzkorrelation verwendet, diese aber als Faltung bezeichnet, weil sie leichter zu implementieren ist.[1]
Definition
Faltung für Funktionen auf Rn
Die Faltung zweier Funktionen ist definiert durch
Um die Definition möglichst allgemein zu halten, schränkt man den Raum der zulässigen Funktionen zunächst nicht ein und fordert stattdessen, dass das Integral für fast alle Werte von wohldefiniert ist. Eine äquivalente Definition ergibt sich durch die Kommutativität der Faltung.
Im Fall , also für zwei integrierbare Funktionen (insbesondere bedeutet das, dass das uneigentliche Betragsintegral endlich ist), kann man zeigen, dass diese Voraussetzung immer erfüllt ist, siehe Satz von Fubini.[2]
Faltung periodischer Funktionen
Für periodische Funktionen und einer reellen Variablen mit Periode definiert man die Faltung als
- ,
wobei sich die Integration über ein beliebiges Intervall mit Periodenlänge erstreckt. Es ist wiederum eine periodische Funktion mit Periode .
Faltung für Funktionen auf Intervallen
Im Fall eines beschränkten Definitionsbereichs setzt man und auf den gesamten Raum fort, um die Faltung ausführen zu können. Hierzu gibt es je nach Anwendung mehrere Ansätze.
- Fortsetzung durch Null
- Man setzt die Funktionen per Definition außerhalb des Definitionsbereiches durch die Nullfunktion fort: .
- Periodische Fortsetzung
- Man setzt die Funktionen außerhalb des Definitionsbereiches periodisch fort und verwendet die für periodische Funktionen definierte Faltung.
Im Allgemeinen ist die Faltung für derart fortgesetzte Funktionen nicht mehr wohldefiniert. Eine oft auftretende Ausnahme bilden stetige Funktionen mit kompaktem Träger , die durch Null zu einer integrierbaren Funktion in fortsetzbar sind.
Bedeutung
Eine anschauliche Deutung der eindimensionalen Faltung ist die Gewichtung einer von der Zeit abhängigen Funktion mit einer anderen. Der Funktionswert der Gewichtsfunktion an einer Stelle gibt an, wie stark der um zurückliegende Wert der gewichteten Funktion, also , in den Wert der Ergebnisfunktion zum Zeitpunkt eingeht.
Die Faltung ist ein geeignetes Modell zur Beschreibung zahlreicher physikalischer Vorgänge.
Glättungskern
Eine Methode, eine Funktion zu „glätten“, besteht darin, sie mit einem so genannten Glättungskern zu falten. Die entstehende Funktion ist glatt (unendlich oft stetig differenzierbar), ihr Träger ist nur etwas größer als der von , und die Abweichung in der L1-Norm lässt sich durch eine vorgegebene positive Konstante beschränken.
Ein -dimensionaler Glättungskern oder Mollifier ist eine unendlich oft stetig differenzierbare Funktion , die nichtnegativ ist, ihren Träger in der abgeschlossenen Einheitskugel hat und das Integral 1, durch entsprechende Wahl einer Konstanten , besitzt.
Ein Beispiel ist der Glättungskern
wobei eine Normierungskonstante ist.
Aus dieser Funktion kann man weitere Glättungskerne bilden, indem man für setzt:
- wobei für .
Die sich ergebenden Glättungskerne für und sind im Folgenden dargestellt:
Beispiele
Rechteckfunktion
Sei
- .
Durch Faltung von (rot dargestellt) mit dem Glättungskern entsteht eine glatte Funktion (blau dargestellt) mit kompaktem Träger, die von f in der L1-Norm um etwa 0,4 abweicht, d. h.
- .
Bei der Faltung mit für e kleiner 1/2 erhält man glatte Funktionen, die in der Integralnorm noch dichter bei f liegen.
Normalverteilung
Wird eine Normalverteilung mit dem Mittelwert und der Standardabweichung gefaltet mit einer zweiten Normalverteilung mit den Parametern und , so ergibt sich wieder eine Normalverteilung mit dem Mittelwert und der Standardabweichung .
Beweis |
---|
|
Damit lässt sich die Gaußsche Fehleraddition (Fehlerfortplanzungsgesetz) begründen: Gegeben seien zwei Stäbe mit fehlerbehafteten Längen und . Will man nun wissen, wie lang der zusammengesetzte Stab ist, dann kann man die beiden Stäbe als zufallsverteiltes Ensemble betrachten. Das heißt, die Messungen von Stab 1 und Stab 2 unterliegen jeweils einer Streuung, welche der Normalverteilung folgt. Es kann z. B. sein, dass Stab 1 in Wirklichkeit lang ist. Dieses Ereignis tritt mit einer bestimmten Wahrscheinlichkeit auf, dass man aus dem Streumaß der Normalverteilung um den Mittelwert ablesen kann. Für dieses Ereignis ist dann die Gesamtlänge der beiden Stäbe normalverteilt, und zwar mit der Normalverteilung des 2. Stabes multipliziert mit der Wahrscheinlichkeit, dass der 1. Stab lang ist. Geht man dies für alle Stablängen für Stab 1 durch und addiert die Verteilungen des zusammengesetzten Stabes, dann entspricht dies der im Beweis angegebenen Integration, welche äquivalent einer Faltung ist. Der zusammengesetzte Stab ist also auch normalverteilt und lang.
Eigenschaften der Faltung
Algebraische Eigenschaften
Die Faltung von -Funktionen erfüllt zusammen mit der Addition fast alle Axiome eines kommutativen Rings mit Ausnahme dessen, dass diese Struktur kein neutrales Element besitzt. Man spricht scherzhaft auch von einem "Rng", weil das i für "Identität" fehlt. Im Detail gelten also die folgenden Eigenschaften:
- Assoziativität mit der skalaren Multiplikation
- Wobei eine beliebige komplexe Zahl ist.
Ableitungsregel
Dabei ist die distributionelle Ableitung von . Falls (total) differenzierbar ist, so stimmen distributionelle Ableitung und (totale) Ableitung überein. Zwei interessante Beispiele dazu sind:
- , wobei die Ableitung der Delta-Distribution ist. Die Ableitung lässt sich also als Faltungsoperator auffassen.
- , wobei die Sprungfunktion ist, ergibt eine Stammfunktion für .
Integration
Sind und integrierbare Funktionen, so gilt
Dies ist eine einfache Folgerung aus dem Satz von Fubini.
Faltungstheorem
stellt sich die Faltung zweier Funktionen als Produkt der einzelnen Fouriertransformierten dar:
Ein ähnliches Theorem gilt auch für die Laplacetransformation. Die Umkehrung des Faltungssatzes besagt[3]:
Dabei ist das punktweise Produkt der beiden Funktionen, ist also gleichbedeutend mit an jeder Stelle .
Spiegelungsoperator
Es sei der Spiegelungsoperator mit für alle , dann gilt
- und
Faltung dualer Lp-Funktionen ist stetig
Sei und mit und . Dann ist die Faltung eine beschränkte stetige Funktion auf . Ist , so verschwindet die Faltung im Unendlichen, ist also eine -Funktion. Diese Aussage ist ebenfalls richtig, wenn eine reelle Hardy-Funktion ist und in BMO liegt.
Verallgemeinerte Young’sche Ungleichung
Aus der Hölder’schen Ungleichung folgt die verallgemeinerte Young’sche Ungleichung
für und .
Faltung als Integraloperator
Sei , dann kann man die Faltung auch als Integraloperator mit dem Integralkern auffassen. Das heißt, man kann die Faltung als Operator definiert durch
auffassen. Dies ist ein linearer und kompakter Operator, der außerdem normal ist. Sein adjungierter Operator ist gegeben durch
Außerdem ist ein Hilbert-Schmidt-Operator.
Diskrete Faltung
In der digitalen Signalverarbeitung und der digitalen Bildverarbeitung hat man es meist mit diskreten Funktionen zu tun, die miteinander gefaltet werden sollen. In diesem Fall tritt an die Stelle des Integrals eine Summe und man spricht von der zeitdiskreten Faltung.
Definition
Seien Funktionen mit dem diskreten Definitionsbereich . Dann ist die diskrete Faltung definiert durch
- .
Der Summationsbereich ist der gesamte Definitionsbereich beider Funktionen. Im Fall eines beschränkten Definitionsbereichs werden und meist durch Nullen fortgesetzt.
Ist der Definitionsbereich endlich, so können die beiden Funktionen auch als Vektoren , respektive verstanden werden. Die Faltung ist dann gegeben als Matrix-Vektor-Produkt:
mit der Matrix
mit und [4]
Wenn man die Spalten von unter und über den periodisch fortsetzt, statt mit Nullen zu ergänzen, wird zu einer zyklischen Matrix, und man erhält die zyklische Faltung.
Anwendungen
Das Produkt zweier Polynome und ist zum Beispiel die diskrete Faltung ihrer mit Nullen fortgesetzten Koeffizientenfolgen. Die dabei auftretenden unendlichen Reihen haben stets nur endlich viele Summanden, die ungleich Null sind. Analog definiert man das Produkt zweier formaler Laurentreihen mit endlichem Hauptteil.
Ein in Bezug auf die Rechenleistung effizienter Algorithmus für die Berechnung der diskreten Faltung ist die Schnelle Faltung, die sich ihrerseits auf die Schnelle Fourier-Transformation (FFT) zur effizienten Berechnung der diskreten Fourier-Transformation stützt.
Distributionen
Die Faltung wurde von Laurent Schwartz, der als Begründer der Distributionentheorie gilt, auf Distributionen erweitert.[5]
Faltung mit einer Funktion
Eine andere Verallgemeinerung ist die Faltung einer Distribution mit einer Funktion . Diese ist definiert durch
wobei ein Translations- und Spiegelungsoperator ist, welcher durch definiert ist.
Faltung zweier Distributionen
Seien und zwei Distributionen, wobei eine einen kompakten Träger hat. Dann ist für alle die Faltung zwischen diesen Distributionen definiert durch
- .
Eine weitergehende Aussage stellt sicher, dass es eine eindeutige Distribution gibt mit
für alle .
Algebraische Eigenschaften
Seien , und Distributionen, dann gilt
- Assoziativität mit der skalaren Multiplikation
- Wobei eine beliebige komplexe Zahl ist.
-
Neutrales Element
- , wobei die Delta-Distribution ist.
Faltungstheorem
Mit wird die (unitäre) Fourier-Transformation von Distributionen bezeichnet. Sei nun eine temperierte Distribution und eine Distribution mit kompaktem Träger. Dann ist und es gilt
- .
Topologische Gruppen
Faltung auf topologischen Gruppen
Die beiden Faltungsbegriffe können gemeinsam beschrieben und verallgemeinert werden durch einen allgemeinen Faltungsbegriff für komplexwertige m-integrierbare Funktionen auf einer geeigneten topologischen Gruppe G mit einem Maß m (z. B. einer lokalkompakten hausdorffschen topologischen Gruppe mit einem Haar-Maß):
Dieser Faltungsbegriff spielt eine zentrale Rolle in der Darstellungstheorie dieser Gruppen, deren wichtigste Vertreter die Lie-Gruppen bilden. Die Algebra der integrierbaren Funktionen mit dem Faltungsprodukt ist für kompakte Gruppen das Analogon zum Gruppenring einer endlichen Gruppe. Weiterführende Themen sind:
Die Faltungsalgebra endlicher Gruppen
Für eine endliche Gruppe mit wird die Menge mit der Addition und der skalaren Multiplikation ein -Vektorraum, isomorph zu Mit der Faltung
wird dann zu einer Algebra, genannt die Faltungsalgebra.
Die Faltungsalgebra besitzt eine Basis indiziert mit den Gruppenelementen wobei
Mit der Faltung gilt:
Wir definieren eine Abbildung zwischen und indem wir für Basiselemente definieren: und linear fortsetzen. Diese Abbildung ist offensichtlich bijektiv. Man erkennt an obiger Gleichung für die Faltung zweier Basiselemente aus dass die Multiplikation in der in entspricht. Damit sind die Faltungsalgebra und die Gruppenalgebra als Algebren isomorph.
Mit der Involution wird zu einer -Algebra. Es gilt
Eine Darstellung einer Gruppe setzt fort zu einem -Algebrenhomomorphismus durch
Da als -Algebrenhomomorphismus insbesondere multiplikativ ist, erhalten wir Falls unitär ist, gilt außerdem Die Definition einer unitären Darstellung findet sich im Kapitel Eigenschaften. Dort wird auch gezeigt, dass wir eine lineare Darstellung ohne Einschränkung als unitär annehmen können.
Im Rahmen der Faltungsalgebra kann man auf Gruppen eine Fouriertransformation durchführen. In der Harmonischen Analyse wird gezeigt, dass diese Definition mit der Definition der Fouriertransformation auf konsistent ist.
Sei eine Darstellung, dann definiert man die Fouriertransformierte durch die Formel
Es gilt dann
Anwendung
- In der Bildbearbeitung und in der Bildverarbeitung wird die diskrete Faltung eingesetzt, um entweder störende Einflüsse wie Rauschen zu beheben oder Bildinformationen wie z. B. Kanten zu extrahieren (Kantendetektion). Dabei kommen der Aufgabenstellung angepasste Faltungsmatrizen zum Einsatz, die als Operatorvorschrift für den Glättungskern zu verstehen sind.
- Bei einem linearen, zeitinvarianten Übertragungsglied ergibt sich die Antwort auf eine Anregung durch Faltung der Anregungsfunktion mit der Impulsantwort des Übertragungsglieds. Beispielsweise stellt die lineare Filterung eines elektronischen Signals die Faltung der Original-Funktion mit der Impulsantwort dar.
- Faltungen werden genutzt, um spezielle Lösungen bestimmter partieller Differentialgleichungen zu konstruieren. Ist die Fundamentallösung des partiellen Differentialoperators , so ist eine Lösung der partiellen Differentialgleichung .
- Diffusions-Prozesse lassen sich durch die Faltung beschreiben.
- Wenn und zwei stochastisch unabhängige Zufallsvariablen mit den Wahrscheinlichkeitsdichten und sind, dann ist die Dichte der Summe gleich der Faltung .
- In der Akustik (Musik) wird die Faltung (unter Zuhilfenahme der FFT = schnelle Fouriertransformation) auch zur digitalen Erzeugung von Hall und Echos und zur Anpassung von Klangeigenschaften verwendet. Dazu wird die Impulsantwort des Raumes, dessen Klangcharakteristik man übernehmen möchte, mit dem Signal, das man beeinflussen möchte, gefaltet.
- In der Ingenieurmathematik und der Signalverarbeitung werden Eingangssignale (äußere Einflüsse) mit der Impulsantwort (Reaktion des betrachteten Systems auf einen Diracimpuls als Signaleingang, auch Gewichtsfunktion) gefaltet, um die Antwort eines LTI-Systems auf beliebige Eingangssignale zu berechnen. Die Impulsantwort ist nicht zu verwechseln mit der Sprungantwort. Erstere beschreibt die Gesamtheit aus System und einem Dirac-Impuls als Eingangs-Testfunktion, letztere die Gesamtheit aus System und einer Sprungfunktion als Eingangs-Testfunktion. Die Berechnungen finden meist nicht im Zeitbereich, sondern im Frequenzbereich statt. Dazu müssen sowohl vom Signal als auch von der das Systemverhalten beschreibenden Impulsantwort Spektralfunktionen im Frequenzbereich vorliegen, oder ggf. aus dem Zeitbereich per Fouriertransformation oder einseitiger Laplacetransformation dorthin transformiert werden. Die entsprechende Spektralfunktion der Impulsantwort wird Frequenzgang oder Übertragungsfunktion genannt.
- In der numerischen Mathematik erhält man durch Faltung der Boxfunktion mit die B-Spline-Basisfunktion für den Vektorraum der stückweisen Polynome vom Grad k.
- In der Computeralgebra kann die Faltung für eine effiziente Berechnung der Multiplikation vielstelliger Zahlen eingesetzt werden, da die Multiplikation im Wesentlichen eine Faltung mit nachfolgendem Übertrag darstellt. Die Komplexität dieses Vorgehens ist mit nahe linear, während das „Schulverfahren“ quadratischen Aufwand hat, wobei die Zahl der Stellen ist. Dies lohnt sich trotz des zusätzlichen Aufwands, der hierbei für die Fouriertransformation (und deren Umkehrung) erforderlich ist.
- In der Hydrologie verwendet man die Faltung, um den durch ein Niederschlags-Abfluss-Ereignis produzierten Abfluss in einem Einzugsgebiet bei vorgegebener Menge und Dauer des Niederschlages zu berechnen. Dazu wird der sogenannte „Unit-Hydrograph“ (Einheits-Abflussganglinie) – die Abflussganglinie auf einen Einheitsniederschlag von vorgegebener Dauer – mit der zeitlichen Funktion des Niederschlages gefaltet.
- In der Reflexionsseismik wird eine seismische Spur als Faltung von Impedanzkontrasten der geologischen Schichtgrenzen und dem Ausgangssignal (Wavelet) betrachtet. Der Vorgang zur Wiederherstellung der unverzerrten Schichtgrenzen im Seismogramm ist die Dekonvolution.
Literatur
- N. Bourbaki: Integration. Springer, Berlin u. a. 2004, ISBN 3-540-41129-1.
- Kôsaku Yosida: Functional Analysis. Springer-Verlag, Berlin u. a. 1995, ISBN 3-540-58654-7.
Einzelnachweise und Fußnoten
- ↑ Ian Goodfellow, Yoshua Bengio und Aaron Courville: Deep Learning. Hrsg.: MIT Press. S. 329 (deeplearningbook.org).
- ↑ Allgemeiner kann auch für ein und vorausgesetzt werden. Vgl. Herbert Amann, Joachim Escher: Analysis III. 1. Auflage. Birkhäuser-Verlag, Basel/Boston/Berlin 2001, ISBN 3-7643-6613-3, Abschnitt 7.1.
- ↑ Beweis mittels Einsetzen der inversen Fouriertransformierten. Z. B. wie in Fouriertransformation für Fußgänger, Tilman Butz, Ausgabe 7, Springer DE, 2011, ISBN 978-3-8348-8295-0, S. 53, Google Books
- ↑ (Seite nicht mehr abrufbar, Suche in Webarchiven: dt.e-technik.uni-dortmund.de) (PDF).
- ↑ Dirk Werner: Funktionalanalysis. 6., korrigierte Auflage, Springer-Verlag, Berlin 2007, ISBN 978-3-540-72533-6, S. 447.