Combinazioni convesse di matrici densità

Selezioni probabilistiche di matrici densità

Un aspetto fondamentale delle matrici densità è che le selezioni probabilistiche di stati quantistici sono rappresentate da combinazioni convesse delle rispettive matrici densità associate.

Ad esempio, se abbiamo due matrici densità, $\rho$ e $\sigma,$ che rappresentano stati quantistici di un sistema $\mathsf{X},$ e prepariamo il sistema nello stato $\rho$ con probabilità $p$ e nello stato $\sigma$ con probabilità $1 - p,$ allora lo stato quantistico risultante è rappresentato dalla matrice densità

p \rho + (1 - p) \sigma.

Più in generale, se abbiamo $m$ stati quantistici rappresentati dalle matrici densità $\rho_0,\ldots,\rho_{m-1},$ e un sistema viene preparato nello stato $\rho_k$ con probabilità $p_k$ per qualche vettore di probabilità $(p_0,\ldots,p_{m-1}),$ lo stato risultante è rappresentato dalla matrice densità

\sum_{k = 0}^{m-1} p_k \rho_k.

Questa è una combinazione convessa delle matrici densità $\rho_0,\ldots,\rho_{m-1}.$

Ne segue che se abbiamo $m$ vettori di stato quantistico $\vert\psi_0\rangle,\ldots,\vert\psi_{m-1}\rangle,$ e prepariamo un sistema nello stato $\vert\psi_k\rangle$ con probabilità $p_k$ per ogni $k\in\{0,\ldots,m-1\},$ lo stato che otteniamo è rappresentato dalla matrice densità

\sum_{k = 0}^{m-1} p_k \vert\psi_k\rangle\langle\psi_k\vert.

Ad esempio, se un qubit viene preparato nello stato $\vert 0\rangle$ con probabilità $1/2$ e nello stato $\vert + \rangle$ con probabilità $1/2,$ la rappresentazione in forma di matrice densità dello stato che otteniamo è data da

\frac{1}{2} \vert 0\rangle\langle 0 \vert + \frac{1}{2} \vert +\rangle\langle + \vert = \frac{1}{2} \begin{pmatrix} 1 & 0\\[1mm] 0 & 0 \end{pmatrix} + \frac{1}{2} \begin{pmatrix} \frac{1}{2} & \frac{1}{2}\\[2mm] \frac{1}{2} & \frac{1}{2} \end{pmatrix} = \begin{pmatrix} \frac{3}{4} & \frac{1}{4}\\[2mm] \frac{1}{4} & \frac{1}{4} \end{pmatrix}.

Nella formulazione semplificata dell'informazione quantistica, fare la media di vettori di stato quantistico in questo modo non funziona. Ad esempio, il vettore

\frac{1}{2} \vert 0\rangle + \frac{1}{2} \vert + \rangle = \frac{1}{2} \begin{pmatrix}1\\[1mm] 0\end{pmatrix} + \frac{1}{2} \begin{pmatrix}\frac{1}{\sqrt{2}}\\[2mm]\frac{1}{\sqrt{2}}\end{pmatrix} = \begin{pmatrix}\frac{2 + \sqrt{2}}{4}\\[2mm]\frac{\sqrt{2}}{4}\end{pmatrix}

non è un vettore di stato quantistico valido perché la sua norma euclidea non è uguale a $1.$ Un esempio ancora più estremo che mostra come questo approccio non funzioni per i vettori di stato quantistico è il seguente: fissiamo un qualsiasi vettore di stato quantistico $\vert\psi\rangle$ a nostra scelta, e poi prendiamo il nostro stato come $\vert\psi\rangle$ con probabilità $1/2$ e $-\vert\psi\rangle$ con probabilità $1/2.$ Questi stati differiscono solo per una fase globale, quindi in realtà rappresentano lo stesso stato — ma facendo la media si ottiene il vettore zero, che non è un vettore di stato quantistico valido.

Lo stato completamente misto

Supponiamo di impostare lo stato di un qubit su $\vert 0\rangle$ o $\vert 1\rangle$ in modo casuale, ciascuno con probabilità $1/2.$ La matrice densità che rappresenta lo stato risultante è la seguente.

\frac{1}{2} \vert 0\rangle\langle 0\vert + \frac{1}{2} \vert 1\rangle\langle 1\vert = \frac{1}{2} \begin{pmatrix} 1 & 0\\[1mm] 0 & 0 \end{pmatrix} + \frac{1}{2} \begin{pmatrix} 0 & 0\\[1mm] 0 & 1 \end{pmatrix} = \begin{pmatrix} \frac{1}{2} & 0\\[1mm] 0 & \frac{1}{2} \end{pmatrix} = \frac{1}{2} \mathbb{I}

(In questa equazione il simbolo $\mathbb{I}$ denota la matrice identità $2\times 2.$ ) Questo è uno stato speciale noto come stato completamente misto. Rappresenta una completa incertezza sullo stato di un qubit, analogamente a un bit casuale uniforme nel contesto probabilistico.

Ora supponiamo di cambiare la procedura: al posto degli stati $\vert 0\rangle$ e $\vert 1\rangle$ useremo gli stati $\vert + \rangle$ e $\vert - \rangle.$ Possiamo calcolare la matrice densità che descrive lo stato risultante in modo analogo.

\frac{1}{2} \vert +\rangle\langle +\vert + \frac{1}{2} \vert -\rangle\langle -\vert = \frac{1}{2} \begin{pmatrix} \frac{1}{2} & \frac{1}{2}\\[2mm] \frac{1}{2} & \frac{1}{2} \end{pmatrix} + \frac{1}{2} \begin{pmatrix} \frac{1}{2} & -\frac{1}{2}\\[2mm] -\frac{1}{2} & \frac{1}{2} \end{pmatrix} = \begin{pmatrix} \frac{1}{2} & 0\\[2mm] 0 & \frac{1}{2} \end{pmatrix} = \frac{1}{2} \mathbb{I}

È la stessa matrice densità di prima, anche se abbiamo cambiato gli stati. In effetti, otterremmo di nuovo lo stesso risultato — lo stato completamente misto — sostituendo qualsiasi coppia di vettori di stato ortogonali di un qubit al posto di $\vert 0\rangle$ e $\vert 1\rangle.$

Questa è una caratteristica, non un difetto! In entrambi i casi otteniamo esattamente lo stesso stato. Cioè, non c'è modo di distinguere le due procedure misurando il qubit che producono, nemmeno in senso statistico. Le nostre due procedure diverse sono semplicemente modi differenti di preparare questo stato.

Possiamo verificare che questo abbia senso ragionando su cosa potremmo sperare di apprendere data una selezione casuale di uno stato da uno dei due possibili insiemi di stati $\{\vert 0\rangle,\vert 1\rangle\}$ e $\{\vert +\rangle,\vert -\rangle\}.$ Per semplicità, supponiamo di eseguire un'operazione unitaria $U$ sul nostro qubit e poi di misurare nella base standard.

Nel primo scenario, lo stato del qubit viene scelto uniformemente dall'insieme $\{\vert 0\rangle,\vert 1\rangle\}.$ Se lo stato è $\vert 0\rangle,$ otteniamo i risultati $0$ e $1$ con probabilità

\vert \langle 0 \vert U \vert 0 \rangle \vert^2 \quad\text{e}\quad \vert \langle 1 \vert U \vert 0 \rangle \vert^2

rispettivamente. Se lo stato è $\vert 1\rangle,$ otteniamo i risultati $0$ e $1$ con probabilità

\vert \langle 0 \vert U \vert 1 \rangle \vert^2 \quad\text{e}\quad \vert \langle 1 \vert U \vert 1 \rangle \vert^2.

Poiché ciascuna delle due possibilità si verifica con probabilità $1/2,$ otteniamo il risultato $0$ con probabilità

\frac{1}{2}\vert \langle 0 \vert U \vert 0 \rangle \vert^2 + \frac{1}{2}\vert \langle 0 \vert U \vert 1 \rangle \vert^2

e il risultato $1$ con probabilità

\frac{1}{2}\vert \langle 1 \vert U \vert 0 \rangle \vert^2 + \frac{1}{2}\vert \langle 1 \vert U \vert 1 \rangle \vert^2.

Entrambe queste espressioni sono uguali a $1/2.$ Un modo per dimostrarlo è usare un fatto di algebra lineare che può essere visto come una generalizzazione del teorema di Pitagora.

Teorema

Supponi che $\{\vert\psi_1\rangle,\ldots,\vert\psi_n\rangle\}$ sia una base ortonormale di uno spazio vettoriale (reale o complesso) $\mathcal{V}.$ Per ogni vettore $\vert \phi\rangle \in \mathcal{V}$ si ha $\vert \langle \psi_1\vert\phi\rangle\vert^2 + \cdots + \vert \langle \psi_n \vert \phi \rangle\vert^2 = \| \vert\phi\rangle \|^2.$

Possiamo applicare questo teorema per determinare le probabilità come segue. La probabilità di ottenere $0$ è

\begin{aligned} \frac{1}{2}\vert \langle 0 \vert U \vert 0 \rangle \vert^2 + \frac{1}{2}\vert \langle 0 \vert U \vert 1 \rangle \vert^2 & = \frac{1}{2} \Bigl( \vert \langle 0 \vert U \vert 0 \rangle \vert^2 + \vert \langle 0 \vert U \vert 1 \rangle \vert^2 \Bigr) \\[2mm] & = \frac{1}{2} \Bigl( \vert \langle 0 \vert U^{\dagger} \vert 0 \rangle \vert^2 + \vert \langle 1 \vert U^{\dagger} \vert 0 \rangle \vert^2 \Bigr)\\[2mm] & = \frac{1}{2} \bigl\| U^{\dagger} \vert 0 \rangle \bigr\|^2 \end{aligned}

e la probabilità di ottenere $1$ è

\begin{aligned} \frac{1}{2}\vert \langle 1 \vert U \vert 0 \rangle \vert^2 + \frac{1}{2}\vert \langle 1 \vert U \vert 1 \rangle \vert^2 & = \frac{1}{2} \Bigl( \vert \langle 1 \vert U \vert 0 \rangle \vert^2 + \vert \langle 1 \vert U \vert 1 \rangle \vert^2 \Bigr) \\[2mm] & = \frac{1}{2} \Bigl( \vert \langle 0 \vert U^{\dagger} \vert 1 \rangle \vert^2 + \vert \langle 1 \vert U^{\dagger} \vert 1 \rangle \vert^2 \Bigr)\\[2mm] & = \frac{1}{2} \bigl\| U^{\dagger} \vert 1 \rangle \bigr\|^2. \end{aligned}

Poiché $U$ è unitaria, sappiamo che $U^{\dagger}$ è unitaria anch'essa, il che implica che sia $U^{\dagger} \vert 0 \rangle$ che $U^{\dagger} \vert 1 \rangle$ sono vettori unitari. Entrambe le probabilità sono quindi uguali a $1/2.$ Ciò significa che, indipendentemente da come scegliamo $U,$ otterremo semplicemente un bit casuale uniforme dalla misurazione.

Possiamo effettuare una verifica analoga per qualsiasi altra coppia di stati ortonormali al posto di $\vert 0\rangle$ e $\vert 1\rangle.$ Ad esempio, poiché $\{\vert + \rangle, \vert - \rangle\}$ è una base ortonormale, la probabilità di ottenere il risultato di misurazione $0$ nella seconda procedura è

\frac{1}{2}\vert \langle 0 \vert U \vert + \rangle \vert^2 + \frac{1}{2}\vert \langle 0 \vert U \vert - \rangle \vert^2 = \frac{1}{2} \bigl\| U^{\dagger} \vert 0 \rangle \bigr\|^2 = \frac{1}{2}

e la probabilità di ottenere $1$ è

\frac{1}{2}\vert \langle 1 \vert U \vert + \rangle \vert^2 + \frac{1}{2}\vert \langle 1 \vert U \vert - \rangle \vert^2 = \frac{1}{2} \bigl\| U^{\dagger} \vert 1 \rangle \bigr\|^2 = \frac{1}{2}.

In particolare, otteniamo esattamente le stesse statistiche di output di quelle ottenute per gli stati $\vert 0\rangle$ e $\vert 1\rangle.$

Stati probabilistici

Gli stati classici possono essere rappresentati da matrici densità. In particolare, per ogni stato classico $a$ di un sistema $\mathsf{X},$ la matrice densità

\rho = \vert a\rangle \langle a \vert

rappresenta $\mathsf{X}$ che si trova definitivamente nello stato classico $a.$ Per i qubit abbiamo

\vert 0\rangle \langle 0 \vert = \begin{pmatrix}1 & 0 \\ 0 & 0\end{pmatrix} \quad\text{e}\quad \vert 1\rangle \langle 1 \vert = \begin{pmatrix}0 & 0 \\ 0 & 1\end{pmatrix},

e in generale abbiamo un singolo $1$ sulla diagonale nella posizione corrispondente allo stato classico che abbiamo in mente, con tutti gli altri elementi uguali a zero.

Possiamo poi prendere combinazioni convesse di queste matrici densità per rappresentare stati probabilistici. Supponendo per semplicità che il nostro insieme di stati classici sia $\{0,\ldots,n-1\},$ se $\mathsf{X}$ si trova nello stato $a$ con probabilità $p_a$ per ogni $a\in\{0,\ldots,n-1\},$ allora la matrice densità che otteniamo è

\rho = \sum_{a = 0}^{n-1} p_a \vert a\rangle \langle a \vert = \begin{pmatrix} p_0 & 0 & \cdots & 0\\ 0 & p_1 & \ddots & \vdots\\ \vdots & \ddots & \ddots & 0\\ 0 & \cdots & 0 & p_{n-1} \end{pmatrix}.

Nel senso inverso, qualsiasi matrice densità diagonale può essere naturalmente identificata con lo stato probabilistico che si ottiene semplicemente leggendo il vettore di probabilità dalla diagonale.

Per essere chiari, quando una matrice densità è diagonale, non è necessariamente il caso che stiamo parlando di un sistema classico, o che il sistema debba essere stato preparato tramite la selezione casuale di uno stato classico, ma piuttosto che lo stato avrebbe potuto essere ottenuto tramite la selezione casuale di uno stato classico.

Il fatto che gli stati probabilistici siano rappresentati da matrici densità diagonali è coerente con l'intuizione suggerita all'inizio della lezione secondo cui gli elementi fuori dalla diagonale descrivono il grado in cui i due stati classici corrispondenti alla riga e alla colonna di quell'elemento si trovano in sovrapposizione quantistica. Qui, tutti gli elementi fuori dalla diagonale sono zero, quindi abbiamo solo casualità classica e nulla è in sovrapposizione quantistica.

Matrici densità e il teorema spettrale

Abbiamo visto che se prendiamo una combinazione convessa di stati puri,

\rho = \sum_{k = 0}^{m-1} p_k \vert \psi_k\rangle \langle \psi_k \vert,

otteniamo una matrice densità. Ogni matrice densità $\rho,$ in realtà, può essere espressa come combinazione convessa di stati puri in questo modo. Cioè, esisterà sempre una collezione di vettori unitari $\{\vert\psi_0\rangle,\ldots,\vert\psi_{m-1}\rangle\}$ e un vettore di probabilità $(p_0,\ldots,p_{m-1})$ per cui l'equazione precedente è vera.

Possiamo inoltre sempre scegliere il numero $m$ in modo che coincida con il numero di stati classici del sistema considerato, e possiamo scegliere i vettori di stato quantistico in modo che siano ortogonali. Il teorema spettrale, che abbiamo incontrato nel corso "Foundations of quantum algorithms", ci permette di concludere questo. Ecco una riformulazione del teorema spettrale per comodità.

Teorema

Teorema spettrale: Sia $M$ una matrice complessa $n\times n$ normale. Esiste una base ortonormale di vettori complessi $n$ -dimensionali $\{\vert\psi_0\rangle,\ldots,\vert\psi_{n-1}\rangle \}$ insieme a numeri complessi $\lambda_0,\ldots,\lambda_{n-1}$ tali che

M = \lambda_0 \vert \psi_0\rangle\langle \psi_0\vert + \cdots + \lambda_{n-1} \vert \psi_{n-1}\rangle\langle \psi_{n-1}\vert.

(Ricorda che una matrice $M$ è normale se soddisfa $M^{\dagger} M = M M^{\dagger}.$ In altre parole, le matrici normali sono matrici che commutano con il proprio trasposto coniugato.)

Possiamo applicare il teorema spettrale a qualsiasi matrice densità $\rho$ perché le matrici densità sono sempre hermitiane e quindi normali. Questo ci permette di scrivere

\rho = \lambda_0 \vert \psi_0\rangle\langle \psi_0\vert + \cdots + \lambda_{n-1} \vert \psi_{n-1}\rangle\langle \psi_{n-1}\vert

per qualche base ortonormale $\{\vert\psi_0\rangle,\ldots,\vert\psi_{n-1}\rangle\}.$ Resta da verificare che $(\lambda_0,\ldots,\lambda_{n-1})$ sia un vettore di probabilità, che potremo poi rinominare in $(p_0,\ldots,p_{n-1})$ se lo desideriamo.

I numeri $\lambda_0,\ldots,\lambda_{n-1}$ sono gli autovalori di $\rho,$ e poiché $\rho$ è semidefinita positiva, questi numeri devono essere numeri reali non negativi. Possiamo concludere che $\lambda_0 + \cdots + \lambda_{n-1} = 1$ dal fatto che $\rho$ ha traccia uguale a $1.$ Esaminare i dettagli ci darà l'opportunità di evidenziare la seguente proprietà importante e molto utile della traccia.

Teorema

Proprietà ciclica della traccia: Per due matrici qualsiasi $A$ e $B$ che, moltiplicandole, danno una matrice quadrata $AB,$ vale l'uguaglianza $\operatorname{Tr}(AB) = \operatorname{Tr}(BA).$

Si noti che questo teorema vale anche se $A$ e $B$ non sono esse stesse matrici quadrate. Cioè, possiamo avere che $A$ sia $n\times m$ e $B$ sia $m\times n,$ per qualche scelta di interi positivi $n$ e $m,$ in modo che $AB$ sia una matrice quadrata $n\times n$ e $BA$ sia $m\times m.$

In particolare, se poniamo $A$ uguale al vettore colonna $\vert\phi\rangle$ e $B$ uguale al vettore riga $\langle \phi\vert,$ vediamo che

\operatorname{Tr}\bigl(\vert\phi\rangle\langle\phi\vert\bigr) = \operatorname{Tr}\bigl(\langle\phi\vert\phi\rangle\bigr) = \langle\phi\vert\phi\rangle.

La seconda uguaglianza segue dal fatto che $\langle\phi\vert\phi\rangle$ è uno scalare, che possiamo anche pensare come una matrice $1\times 1$ la cui traccia è il suo unico elemento. Usando questo fatto, possiamo concludere che $\lambda_0 + \cdots + \lambda_{n-1} = 1$ grazie alla linearità della funzione traccia.

\begin{gathered} 1 = \operatorname{Tr}(\rho) = \operatorname{Tr}\bigl(\lambda_0 \vert \psi_0\rangle\langle \psi_0\vert + \cdots + \lambda_{n-1} \vert \psi_{n-1}\rangle\langle \psi_{n-1}\vert\bigr)\\[2mm] = \lambda_0 \operatorname{Tr}\bigl(\vert \psi_0\rangle\langle \psi_0\vert\bigr) + \cdots + \lambda_{n-1} \operatorname{Tr}\bigl(\vert \psi_{n-1}\rangle\langle \psi_{n-1}\vert\bigr) = \lambda_0 + \cdots + \lambda_{n-1} \end{gathered}

In alternativa, possiamo giungere alla stessa conclusione usando il fatto che la traccia di una matrice quadrata (anche di una che non è normale) è uguale alla somma dei suoi autovalori.

Abbiamo quindi concluso che qualsiasi matrice densità $\rho$ può essere espressa come combinazione convessa di stati puri. Vediamo inoltre che possiamo, in aggiunta, scegliere gli stati puri in modo che siano ortogonali. Ciò significa, in particolare, che non abbiamo mai bisogno che il numero $n$ sia maggiore della dimensione dell'insieme di stati classici di $\mathsf{X}.$

In generale, bisogna comprendere che ci saranno diversi modi per scrivere una matrice densità come combinazione convessa di stati puri, non solo i modi che il teorema spettrale fornisce. Un esempio precedente lo illustra.

\frac{1}{2} \vert 0\rangle\langle 0 \vert + \frac{1}{2} \vert +\rangle\langle + \vert = \begin{pmatrix} \frac{3}{4} & \frac{1}{4}\\[2mm] \frac{1}{4} & \frac{1}{4} \end{pmatrix}

Questa non è una decomposizione spettrale di questa matrice perché $\vert 0\rangle$ e $\vert + \rangle$ non sono ortogonali. Ecco una decomposizione spettrale:

\begin{pmatrix} \frac{3}{4} & \frac{1}{4}\\[2mm] \frac{1}{4} & \frac{1}{4} \end{pmatrix} = \cos^2(\pi/8) \vert \psi_{\pi/8} \rangle \langle \psi_{\pi/8}\vert + \sin^2(\pi/8) \vert \psi_{5\pi/8} \rangle \langle \psi_{5\pi/8}\vert,

dove $\vert \psi_{\theta} \rangle = \cos(\theta)\vert 0\rangle + \sin(\theta)\vert 1\rangle.$ Gli autovalori sono numeri che probabilmente risulteranno familiari:

\cos^2(\pi/8) = \frac{2+\sqrt{2}}{4} \approx 0.85 \quad\text{e}\quad \sin^2(\pi/8) = \frac{2-\sqrt{2}}{4} \approx 0.15.

Gli autovettori possono essere scritti esplicitamente come segue.

\begin{aligned} \vert\psi_{\pi/8}\rangle & = \frac{\sqrt{2 + \sqrt{2}}}{2}\vert 0\rangle + \frac{\sqrt{2 - \sqrt{2}}}{2}\vert 1\rangle \\[3mm] \vert\psi_{5\pi/8}\rangle & = -\frac{\sqrt{2 - \sqrt{2}}}{2}\vert 0\rangle + \frac{\sqrt{2 + \sqrt{2}}}{2}\vert 1\rangle \end{aligned}

Come altro esempio più generale, supponiamo che $\vert \phi_0\rangle,\ldots,\vert \phi_{99} \rangle$ siano vettori di stato quantistico che rappresentano stati di un singolo qubit, scelti arbitrariamente — quindi non assumiamo alcuna relazione particolare tra questi vettori. Potremmo quindi considerare lo stato che otteniamo scegliendo uno di questi $100$ stati uniformemente a caso:

\rho = \frac{1}{100} \sum_{k = 0}^{99} \vert \phi_k\rangle\langle \phi_k \vert.

Poiché stiamo parlando di un qubit, la matrice densità $\rho$ è $2\times 2,$ quindi per il teorema spettrale potremmo in alternativa scrivere

\rho = p \vert\psi_0\rangle\langle\psi_0\vert + (1 - p) \vert\psi_1\rangle\langle\psi_1\vert

per qualche numero reale $p\in[0,1]$ e una base ortonormale $\{\vert\psi_0\rangle,\vert\psi_1\rangle\}$ — ma naturalmente l'esistenza di questa espressione non ci impedisce di scrivere $\rho$ come media di 100 stati puri se lo scegliamo.

Selezioni probabilistiche di matrici densità​

Lo stato completamente misto​

Stati probabilistici​

Matrici densità e il teorema spettrale​

Selezioni probabilistiche di matrici densità

Lo stato completamente misto

Stati probabilistici

Matrici densità e il teorema spettrale