Parliamo di 3D

Sla · Messaggio da **Sla** » 28/02/2013, 18:59

Passando il tempo su GMI, leggendo le domande e i topic in generale, mi sono reso conto che l'argomento che va per la maggiore è il 3D. La grafica 3D sembra proprio una destinazione finale, il motivo per cui si cerca di imparare velocemente il 2D visto che spesso viene consigliato di prendere la mano con quello prima di incrementare il numero delle dimensioni. Eppure, spesso e volentieri non si sa come e perché, si ignora totalmente il meraviglioso processo matematico che il rendering in real time cela ai nostri occhi, e non può essere altro che così vista anche la generale carenza di conoscenze matematiche qui sul forum. Non voglio incolpare nessuno, se non è un interesse non è colpa vostra, e anche se lo fosse quasi sempre siete troppo giovani per pretendere che l'istruzione pubblica vi abbia dato ciò che serve, e di certo non cercate di procurarvelo da soli. Le cause? Forse pigrizia, forse la penuria di informazioni in lingua non vi consola, anche se l'inglese sarebbe da conoscere a prescindere.
Non importa. Il mio intento adesso è di fornirvi quell'infarinatura generale di concetti matematici (tra i quali elementi di algebra lineare e trigonometria) che servono per entrare un po' nel dettaglio nella spiegazione del funzionamento di un motore di rendering 3D.
Ho visto che diversi si sono cimentati nella programmazione di un sistema di fake 3d (3d via software invece che hardware, come sarebbe giusto), ma nessuno si è mai preoccupato troppo di fare qualcosa di valido.
Il mio obiettivo è di creare passo-passo un engine di rendering via software, magari sia game maker che in C++, giusto per apprezzare la differenza tra due linguaggi di diverso livello di astrazione nel modello delle virtual machine.
Conto di farlo in più "episodi", non penso di riuscire a scrivere tutto oggi.
Non aspettatevi un rendering in real time, immaginatevi piuttosto qualcosa come potrebbe essere il rendering prodotto dal vostro programma di modeling preferito, lento ma completo. Si tratta solo di un esempio per illustrare le vere tecniche per renderizzare grafica 3D, senza supporto gpu non andrà mai tanto veloce.
Propedeuticità per la guida: nessuna. Quanto scrivo vuole anche essere un buon riferimento matematico per il forum.
Non darò niente per scontato: ogni volta che mi servirà qualche nozione importante la spiegherò in spoiler, in modo da permettere a quelli che già sanno di saltarlo. Naturalmente non mi considero un essere superiore, i più esperti sono caldamente invitati a leggere comunque tutto e a controllare per bene che non abbia lasciato qua e la qualche errore.

EDIT: Lascio l'introduzione precedente per correttezza, ma nel corso della realizzazione di questa guida ho dovuto ridimensionare
il mio obiettivo. Non posso assolutamente lavorare con GM, è troppo, troppo lento. Ero preparato ad affrontare un problema del genere, ma non pensavo fosse così grave. Impiegare dei minuti per vedere qualcosa allunga troppo anche i tempi di debugging, oltre ogni limite imposto dalla mia pazienza.
Lavorerò pertanto solo con qualche linguaggio di più basso livello come il C++. Questo significa che oltre a un piccolo exe dimostrativo, in questo tutorial non vedrete codice, visto che non tutti potrebbero comprenderlo.

Utilizzerò diverse volte l'espressione di sommatoria, pertanto se non sapete cos'è cominciate espandendo lo spoiler.

Spoiler

È praticamente sicuro che prima o poi salterà fuori nella guida qualche riferimento a funzioni trigonometriche quali seno e coseno, pertanto togliamoci adesso il dente e vediamo subito di cosa si tratta.

Nello spoiler seguente:
- definizione di funzione reale per valori reali, di Dominio e Codominio
- cenni di notazione insiemistica
- gli angoli e i radianti
- esempio di funzione: degtorad
- la funzione seno
- la funzione coseno
- esempi: lengthdir_x,y,z

Spoiler

Passiamo adesso a qualche nozione basilare sui vettori, un argomento fondamentale per la grafica 3D.

(1) Lo spoiler seguente contiene:
- definizione e rappresentazione di vettori
- operazioni di somma, prodotto tra vettori
- rappresentazione per combinazione lineare di una base

Spoiler

Il prossimo piccolo, grande passo: le matrici.
Lo prometto: da qui in avanti gli argomenti si faranno sempre più interessanti e vicini al 3D.

(2) Nello spoiler seguente parleremo di:
- sistemi lineari
- matrice associata ad un sistema
- operazioni tra matrici
- matrice inversa
- compatibilità di un sistema
- determinante di una matrice quadrata di terzo ordine

Spoiler

[/color]

Xxshark888xX · Messaggio da **Xxshark888xX** » 28/02/2013, 21:11

Sla ha scritto:Passando il tempo su GMI, leggendo le domande e i topic in generale, mi sono reso conto che l'argomento che va per la maggiore è il 3D. La grafica 3D sembra proprio una destinazione finale, il motivo per cui si cerca di imparare velocemente il 2D visto che spesso viene consigliato di prendere la mano con quello prima di incrementare il numero delle dimensioni. Eppure, spesso e volentieri non si sa come e perché, si ignora totalmente il meraviglioso processo matematico che il rendering in real time cela ai nostri occhi, e non può essere altro che così vista anche la generale carenza di conoscenze matematiche qui sul forum. Non voglio incolpare nessuno, se non è un interesse non è colpa vostra, e anche se lo fosse quasi sempre siete troppo giovani per pretendere che l'istruzione pubblica vi abbia dato ciò che serve, e di certo non cercate di procurarvelo da soli. Le cause? Forse pigrizia, forse la penuria di informazioni in lingua non vi consola, anche se l'inglese sarebbe da conoscere a prescindere.
Non importa. Il mio intento adesso è di fornirvi quell'infarinatura generale di concetti matematici (tra i quali elementi di algebra lineare e trigonometria) che servono per entrare un po' nel dettaglio nella spiegazione del funzionamento di un motore di rendering 3D.
Ho visto che diversi si sono cimentati nella programmazione di un sistema di fake 3d (3d via software invece che hardware, come sarebbe giusto), ma nessuno si è mai preoccupato troppo di fare qualcosa di valido.
Il mio obiettivo è di creare passo-passo un engine di rendering via software, magari sia game maker che in C++, giusto per apprezzare la differenza tra due linguaggi di diverso livello di astrazione nel modello delle virtual machine.
Conto di farlo in più "episodi", non penso di riuscire a scrivere tutto oggi.
Non aspettatevi un rendering in real time, immaginatevi piuttosto qualcosa come potrebbe essere il rendering prodotto dal vostro programma di modeling preferito, lento ma completo. Si tratta solo di un esempio per illustrare le vere tecniche per renderizzare grafica 3D, senza supporto gpu non andrà mai tanto veloce.
Propedeuticità per la guida: nessuna. Quanto scrivo vuole anche essere un buon riferimento matematico per il forum.
Non darò niente per scontato: ogni volta che mi servirà qualche nozione importante la spiegherò in spoiler, in modo da permettere a quelli che già sanno di saltarlo. Naturalmente non mi considero un essere superiore, i più esperti sono caldamente invitati a leggere comunque tutto e a controllare per bene che non abbia lasciato qua e la qualche errore.

Cominciamo con qualche nozione basilare che ci tornerà utile: cos'è un vettore e il prodotto scalare e vettoriale tra due vettori.
Spoiler
Un vettore è una collezione più o meno grande di elementi omogenei matematici. Con elementi matematici intendo veramente una qualunque classe di elementi, a patto che per questa siano definiti operatori di somma e moltiplicazione (tra poco vedremo questa particolarità più nello specifico).
Nel corso di questa guida tratteremo soltanto vettori di numeri reali,quindi d'ora in poi quando parlerò di vettori mi riferirò sempre e soltanto a questo tipo di collezione.
I vettori canonici sono formati da tre numeri reali. Ognuno dei tre numeri è anche chiamato "componente" del vettore. Si è soliti riferirsi alle tre componenti dei vettori con il nome x,y,z, oppure, molto più spesso, se il vettore si chiama "v", le tre componenti si chiamano , , .
Fondamentalmente le informazioni (le componenti) di un vettore "codificano" solamente una direzione nello spazio e, in essa, un verso di percorrenza. Questi vettori vengono anche chiamati liberi e sono rappresentati con un trattino inferiore (come una sottolineatura). Quando questi vettori vengono applicati ad un certo punto nello spazio vengono detti appunto vettori applicati. Spesso i vettori liberi vengono applicati all'origine (0,0,0) e, quindi, le tre componenti possono essere considerate come il punto (0+, 0+, 0+) = (, , ).
I vettori applicati si rappresentano con la famosa freccina sopra il nome, nel nostro caso .
Per semplicità userò quest'ultima notazione per riferirmi a qualunque vettore, sia esso applicato o libero.
La figura seguente mostra la rappresentazione grafica di un vettore dalle componenti 4,4 applicato all'origine in un piano cartesiano 2D. Esso può anche essere considerato come il punto P a cui "punta" (perdonate la sprecisione del disegno, ho fatto a mano..)

Si definisce modulo di un vettore la sua intensità o lunghezza. Per chiarire le idee, consideriamo un vettore applicato all'origine. Il modulo di questo vettore è la sua distanza dall'origine. Si scrive:
, formula che si può ricavare dal teorema di pitagora.
Presi due vettori e , per poter essere chiamati tali, e, quindi, essere elementi di (l'insieme dei vettori con 3 numeri reali), devono soddisfare le seguenti condizioni:

(1.1) ( + ) ,
"il vettore risultante dalla somma di due vettori u,v appartiene a V3, per ogni coppia u,v appartenente a V3 scelta"
(1.2) c , c
"il vettore risultante dal prodotto di un vettore u per un numero reale c appartiene a V3 per ogni coppia <vettore v di V3, numero c reale> scelta "
(1.3) ( x ) ,
"il vettore risultante dal prodotto vettoriale uxv appartiene a V3, per ogni coppia u,v appartenente a V3 scelta"

La prima espressione mostra la somma tra due vettori, che produce un nuovo vettore che ha per componenti la somma membro a membro dei componenti dei due vettori iniziali.

per rappresentare il vettore w è stata usata la notazione per parentesi quadre che racchiude le componenti di w separate dalle virgole.

La seconda espressione compare il prodotto tra un vettore ed un numero reale.Questo prodotto restituisce un vettore le cui componenti sono quelle del vettore di partenza, ciascuna moltiplicata per il numero reale.

Com'è facile intuire, moltiplicare un vettore per uno scalare (un numero reale) equivale alla nota trasformazione per scaling o stretching. Moltiplicando un vettore per 2 otterremo un vettore orientato allo stesso modo ma lungo il doppio; possiamo dimezzarlo moltiplicandolo per 0.5, e così via.

La terza espressione mostra, infine, il prodotto vettoriale tra due vettori, che restituisce ancora un vettore secondo questa regola: (sia alfa l'angolo compreso tra i due vettori)
(1.3)
Questa formula introduce un nuovo vettore .
I vettori scritti in questa notazione sono detti vettori normali e hanno modulo pari a 1.
Questa peculiarità li rende particolarmente comodi, vedremo perché.
In questo caso è da considerare perpendicolare a entrambi i vettori di partenza u e v. L'espressione a destra di è chiaramente una quantità scalare.
Si tratta quindi di un'espressione analoga alla (1.2). Essendo il modulo di pari a 1, il prodotto a (con a scalare) non farà altro che cambiare il modulo di in a.
è dunque semplicemente un manichino, un vettore facilmente modellabile che quindi torna comodo nelle definizioni.

È facile dimostrare che le tre condizioni sono sempre soddisfatte finché si tratta di vettori a numeri reali.

- sono già stanco di scrivere . magari sul piu tardi inserisco prima dei vettori qualche nozione di trigonometria, dato che serve già per il prodotto scalare e vettoriale, e completo per bene la sezione sui vettori. Domani potrei già iniziare a parlare delle matrici.

Tu sei pazzo

Sla · Messaggio da **Sla** » 28/02/2013, 21:19

Parliamo adesso di trasformazioni nello spazio, ovvero le operazioni che capitano più spesso nella grafica 3D.

Nello spoiler:
- introduzione e applicazione di matrici
- ridimensionamenti
- rotazioni
- traslazioni
- trasformazioni consecutive

Spoiler

Dato un punto nello spazio espresso come vettore colonna
Immagine

, il nostro scopo è quello di costruire una matrice che applicata al punto P trasformi le sue coordinate secondo regole specifiche di traslazione (translation), ridimensionamento (scale) o rotazione attorno all'origine (rotation).
Applicare una matrice T ad un punto P significa calcolare il prodotto TP, per questo il punto P deve essere anch'esso una matrice.
Una matrice T con le proprietà discusse si chiama matrice di trasformazione (transformation matrix).
Quello che ci apprestiamo a fare è una ricerca euristica delle proprietà che deve avere una matrice siffatta.
Per quanto riguarda rotazioni e ridimensionamenti possiamo limitarci a considerare matrici 3x3, ma per annoverare anche le traslazioni saremo costretti ad aggiungere una dimensione (4x4), in seguito vedremo perché.

Scaling
Cominciamo a pensare a come potrebbe essere una matrice di ridimensionamento.
Supponiamo di avere una serie di vertici del tipo di P dell'immagine precedente riferiti ad un origine di un sistema cartesiano 3D. Vogliamo applicare ad ogni vertice un fattore di ridimensionamento che li renda più vicini o più lontani dall'origine, ma che non cambi la loro angolazione riespetto a quest'ultima. In pratica vogliamo solo cambiare il modulo del vettore associato ad ogni vertice. Abbiamo già visto che questo tipo di operazione si ottiene moltiplicando ogni componente del singolo vertice P per il fattore k.
Per questo tipo di operazione andrebbe benissimo anche k Immagine

, senza bisogno di fare ricorso alle matrici.
Notiamo tuttavia che in questo modo possiamo solo compiere ridimensionamenti omogenei.
Se il nostro personaggio fosse troppo grasso e volessimo restringerlo solo lungo l'asse X e Y, un prodotto scalare * vettore non sarebbe più sufficiente, perché ne modificherebbe anche l'altezza (Z), senza il minimo beneficio per i suoi problemi di obesità.
Pensiamo allora a come potrebbe essere definita una matrice S che ridimensiona con un valore arbitrario lungo ogni asse.
Un buon punto di partenza è definire S = I, perché in questo modo IP resta P.
Chiamiamo P' il punto P trasformato da S, P' = SP.
Per le proprietà della matrice identità possiamo scrivere
Immagine

con s1,1 , s2,2 , s3,3 tutti 1, essendo S = I.
Ci accorgiamo però che abbiamo ottenuto quello che volevamo moltiplicando ogni componente del vettore P per un fattore che possiamo assegnare arbitrariamente.
Chiamiamo Sx, Sy, Sz i fattori di ridimensionamento lungo uno specifico asse, la matrice S diventa:
Immagine

e concludiamo che dalla sua applicazione su un punto ne risulta il ridimensionamento del punto.

Rotating
"Ruotare un punto di un angolo alfa" non significa niente. Come al solito servono altre informazioni, in questo caso ci mancano i riferimenti.
Possiamo ricavare qualunque orientamento nello spazio ruotando attorno agli assi cartesiani X,Y,Z.
Definiremo allora tre matrici diverse per:
-> ruotare di angolo alfa attorno a X
-> ruotare di un angolo beta attorno a Y
-> ruotare di un angolo gamma attorno a Z
Nota: questo tipo di rotazioni mantiene intatta la distanza di un punto dall'origine del sistema di riferimento cartesiano in cui si trova.

Consideriamo un punto P in un sistema cartesiano R centrato in O(0,0,0) in tre dimensioni, siano Immagine

i versori corrispondenti agli assi {X,Y,Z}.
Consideriamo anche un secondo sistema cartesiano R' centrato nello stesso punto di R, con gli assi sempre perpendicolari tra loro ma orientati in modo diverso da quelli di R, e siano Immagine

i versori relativi agli assi di R'.
Possiamo dire che R' è ruotato in maniera indefinita rispetto ad ogni asse di R.
Chiamiamo P' il vettore colonna con le componenti di P rispetto a R'.
Se riferissimo queste nuove componenti al sistema iniziale R invece di R', avremmo ruotato P in senso opposto rispetto all'orientamento di R'.

Vediamo dove ci porta la matematica (attenzione: la sintassi è rigorosa, se vedete un puntino non è un prodotto normale ma un prodotto scalare tra due vettori)
Immagine

L'ultima relazione ottenuta si presta molto bene a esprimere un prodotto tra matrici. Infatti, se poniamo:
Immagine

l'ultima espressione diventa
Immagine

.
insomma, P' = RP, e abbiamo trovato la nostra matrice di rotazione R, il cui i,k-esimo elemento (i=riga,k=colonna)
Immagine

non è altro che la lunghezza dell'i-esimo versore del nuovo sistema di riferimento rispetto al k-esimo versore del vecchio.
In altre parole la matrice di rotazione R ha come componenti ordinatamente le componenti dei nuovi versori rispetto al riferimento iniziale.

Sappiamo però che con questo tipo di matrice effettuiamo una rotazione in senso opposto rispetto a quello della rotazione degli assi. Se gli assi del nuovo sistema di riferimento sono ruotati di un angolo alfa rispetto a quelli iniziali, la rotazione del punto cui è applicata la matrice è di -alfa.
Notiamo però che fare la rotazione opposta a quella imposta dalla matrice R equivale a invertire R.
Per aggiustare la nostra matrice dovremi quindi invertirla.
Per brevità non voglio dimostrarvelo, ma se si tratta di una matrice di rotazione, l'inversa corrisponde alla trasposta. In una matrice trasposta quelli che sarebbero i vettori riga diventano colonna e viceversa.
Faccio un esempio di rotazione attorno all'asse Z dell'angolo alfa.
Immagine

Translating
Le traslazioni sono un caso eccezionale perché non riusciamo a inserirle nelle matrici 3x3 viste fin'ora senza andare.
Intendiamoci: l'obiettivo è di avere un'unica matrice di trasformazione che applicata una sola volta applichi tutte le trasformazioni che ci abbiamo salvato dentro (in seguito vedremo come fare).
Questo per ottimizzare le prestazioni nella trasformazione di vertici, operazione che viene fatta davvero un numero elevatissimo di volte per ogni renderizzazione di frame.

Con matrici di trasformazione 3x3 non riusciamo a implementare le traslazioni senza intaccare le informazioni di ridimensionamenti e rotazioni, questo per la natura diversa di queste operazioni:
mentre per ruotare o ridimensionare ci servono dei prodotti, per traslare dobbiamo solo sommare ai vertici dei valori nelle direzioni X,Y,Z.
La soluzione è passare a matrici 4x4.

Come al solito, per non far danni, partiamo dalla matrice identità 4x4. È semplice notare che, per le proprietà della matrice identità, la quarta riga e quarta colonna appena aggiunte non producono cambiamenti durante l'applicazione della matrice su un punto. Possiamo estendere le matrici di rotazione e ridimensionamento aggiungendo questa quarta colonna e quarta riga e avremo una matrice di trasformazione che si comporta nello stesso modo di quella ridotta.
Faccio un esempio con la matrice di rotazione attorno all'asse Z calcolata in precedenza:
Immagine

Per compatibilità con il prodotto tra matrici dobbiamo aggiungere un campo anche ai vettori colonna (che prenderà nome di W), che diventano quindi composti da 4 righe e 1 colonna.
Osserviamo che:
Immagine

(potete verificarlo applicando le proprietà del prodotto tra matrici)
Ponento Pw = 1 avremo ottenuto la nostra traslazione del vettore T = {tx,ty,tz}.
Inoltre il punto risultante avrà in automatico di nuovo w = 1.

La matrice di traslazione è dunque:
Immagine

Vorrei farvi notare che possiamo disabilitare le traslazioni in uno specifico vettore colonna 4x1 lasciando W = 0, in questo caso solo rotazioni e ridimensionamenti avranno effetto. Se anche dovessimo traslare tale vettore, il vettore di traslazione diventerebbe {0,0,0}.
Questo può essere utile quando vogliamo tener traccia di una direzione che cambia nello stesso modo in cui vengono trasformate le mesh (i modelli). Un vettore direzione non deve essere traslato, altrimenti si perde l'informazione utile.

Trasformazioni successive
L'ultima cosa che vediamo in questa sezione: come riunire più trasformazioni in una sola così da velocizzare i calcoli?
Consideriamo la matrice di trasformazione T 4x4, a prescindere dal tipo di trasformazione che contiene, vale:
X' = T X, in cui X' è il vettore delle coordinate del punto X trasformato da T.
Supponiamo di voler effettuare una nuova trasformazione T'. Scriveremo ovviamente X'' = T'X'.
Procediamo con X'' = T' ( T X). Per la proprietà associativa del prodotto tra matrici, X'' = (T' T) X.
Possiamo andare avanti con altre trasformazioni:
X''' = (T'' T' T) X. Chiamiamo W (=World, più avanti si capirà il perché di questo nome) la matrice di trasformazione.
Inizialmente, quando ancora nessuna trasformazione è stata applicata, essa sarà la matrice identità I 4x4.
Volendo aggiungere una trasformazione T a W faremo W = TW, che è esattamente il funzionamento di
d3d_transform_add* (rotation_x,y,z, translation, scaling)

Ci avviciniamo sempre di più al disegno dei nostri primi triangoli.

In questo paragrafo:
- mesh
- World Matrix
- View Matrix
- Projection Matrix

Spoiler

Nel corso della guida ci troveremo a disegnare dei modelli.
Un modello è semplicemente un insieme di triangoli, generalmente adiacenti, che formano un solido poligonale nello spazio.
Perché proprio triangoli? Si da il caso che qualunque superficie possa essere approssimata utilizzando dei triangoli. Immaginatevi una superficie curva ideale. Sappiamo che se fosse un oggetto reale sarebbe composto da un elevato numero di atomi e avrebbe un certo spessore, io vorrei invece parlare di superfici che hanno uno spessore nullo. Spessore nullo equivale a non esistente nella realtà, per questo dobbiamo parlare di superficie "ideale". Una superficie ideale è composta da infiniti punti e non ha spessore. Renderizzare infiniti punti è ovviamente un'operazione infinitamente lunga. Nella computer grafica dobbiamo comunque rappresentare qualcosa, e lo facciamo a scapito della qualità della rappresentazione. Infatti, invece di considerare infiniti punti, ne considereremo un numero finito N. Una superficie composta da N degli infiniti punti della corrispondente superficie ideale potrebbe essere una buona approssimazione della superficie ideale. Localmente (nei singoli N punti) si tratta di un'approssimazione perfetta per quanto consentito dal mezzo fisico (precisione di un float o double, a seconda del tipo utilizzato), ma se consideriamo tutti i punti che stanno tra i nostri N, questi saranno ottenuti per interpolazione lineare dei punti noti e avranno un certo errore intrinseco, per questo parliamo di un'approssimazione della superficie ideale, tanto migliore quanti più punti utilizziamo (quanto aumentiamo N).
Inoltre, per dare un'approssimazione globale della superficie ideale, dovremo prendere gli N punti omogeneamente lungo tutta la superficie. Non possiamo certo considerare prendere tutti gli N punti da un angolino della superficie da renderizzare, altrimenti sullo schermo comparirà solo quell'angolino.

Per renderizzare gli N punti ci rendiamo velocemente conto del perché sia importante utilizzare i triangoli.
Potremmo disegnare solamente i punti scelti, ma avremmo una pessima rappresentazione della superficie.
Potremmo disegnare le varie linee che congiungono i punti (e quindi prenderli a gruppi di 2), ma di nuovo, la rappresentazione non sarebbe verosimile (vedi wireframe). Il prossimo passo logico è considerare i punti non singolarmente, non a coppie ma a gruppi di tre.
Ogni gruppo verrà rappresentato come un triangolo. Si noti che attraverso i triangoli raggiungiamo il massimo livello di precisione consentito dalla partizione scelta della superficie ideale in N punti. Se aumentassimo il numero di vertici per gruppo dovremmo interpolare qualche informazione e finiremmo per peggiorare la qualità della rappresentazione, mentre abbiamo visto che diminuendo il numero di vertici rispetto a 3, aumenteremmo sicuramente la precisione (se disegnamo punto per punto caspita, tutto quello che è stato disegnato è un'approssimazione perfetta della superficie ideale, visto che ogni punto appartiene a quest'ultima), ma la rappresentazione non sarebbe soddisfacente.

La geometria si esprime in nostro favore: 3 è il numero minimo di punti per avere una superficie, 3 punti formano sempre un triangolo.

È bene, allora, che il nostro engine abbia delle classi per gestire le mesh,e,quindi, rasterizzare triangoli.
È anche imporante che abbiate ben chiaro che d'ora in poi in questa guida, parlando di mesh, si intenderà collezione di facce (triangoli).

Le mesh vengono salvate in memoria in un sistema di riferimento che viene chiamato Model Space. Si tratta di uno spazio tridimensionale riferito
all'origine O(0,0,0) riservato ad ogni singola mesh. Per fare un esempio, la mesh di un cubo centrato all'origine potrebbe avere vertici che vanno da (1,1,1) a (-1,-1,-1).
Quando renderizzate una mesh in una determinata posizione e orientazione nello spazio, il motore grafico (sia che usiate DirectX che OpenGL) prende
le coordinate dal model space e le trasforma. Il risultato di questa trasformazione
sono coordinate che appartengono al World Space, che è lo spazio del "mondo reale" dell'ambientazione del vostro gioco.
Potremmo immaginare che la mesh di cubo debba rappresentare un dado nel gioco. Questo verrà lanciato e, urtando un tavolino diverse volte, rotolerà
fino a fermarsi su una faccia. Un buon motore fisico ci fornirà ogni istante dei valori di traslazione e rotazione che, se applicati ai vertici del model space, restituiranno nuovi valori appartenenti al mondo reale.
Si noti che le coordinate locali (del model space) di una mesh non vengono alterate dopo ogni trasformazione: quelle coordinate da li non le tocca nessuno, altrimenti non avrebbe senso parlare di spazi locali riservati.
Potremmo anche lavorare senza uno spazio riservato per i vertici del modello, ma così facendo, trasformazione dopo trasformazione, le sue coordinate verrebbero sempre di più "corrotte". Per quanto i dati possano esser precisi c'è quasi sempre un certo margine di approssimazione nei calcoli in virgola mobile, che produrrebbe un errore via via più grande con l'aumentare dei calcoli sui vertici.
Con il metodo del model space invece, a costo della memoria, le coordinate rimangono intatte per tutta la durata del programma.

Un motore di rendering usa una matrice apposita per le trasformazioni viste chiamata World Matrix. La World Matrix può includere una qualunque combinazione di trasformazioni secondo la regola W' = TW già vista (ovvero: se vogliamo combinare una nuova trasformazione T di qualunque tipo {translation,scale,rotation} ad una matice W possiamo moltiplicarla a sinistra per T).
all'inizio W viene settata ad una matrice identità 4x4 (il perché di questa dimensione si è già visto in precedenza), e viene via via modificata.
Per fare un esmepio, d3d_transform_add_rotation_* non fa che costruire una matrice di rotazione e moltiplicarla alla World Matrix corrente.
Il risultato viene salvato in una matrice temporanea e poi copiato nella World Matrix, liberandola dal contenuto precedente.
Le funzioni di tipo d3d_transform_set* si comportano nello stesso modo, solo che prima di applicare la trasformazione alla World Matrix, la rendono
matrice identità 4x4.

Immagine

In quella che viene chiamata rendering pipeline, ogni vertice del model space viene convertito in coordinate schermo (x,y) a seconda:
- della posizione effettiva nel mondo reale (si calcola con la World Matrix)
- della posizione effettiva rispetto alla telecamera (si calcola con la View Matrix, come vedremo)
- delle proprietà della proiezione (fov,aspect,near,far, che metteremo nella Projection Matrix).

Le tre matrici evidenziate sono decisamente utili perché si comportano in modo da fornire velocemente le coordinate a schermo (x,y) partendo dal vertice V nel model space:
V' = World V
V'' = View V'
V''' = Projection V''
dove V''' contiene le (x,y) cercate.
Per renderizzare una mesh passeremo in rassegna tutte le sue facce, una alla volta.
Sappiamo che una faccia è un triangolo, dovremo pertanto analizzare tre vertici alla volta.
Attraverso le WVP convertiremo ogni vertice in coordinate schermo (x,y). In altre parole le WVP ci dicono dove si trova sullo schermo un punto nello spazio guardato dalla telecamera da noi impostata.
Dovremo poi renderizzare il triangolo che unisce le tree coppie di coordinate a schermo (esattamente come farebbe un draw_triangle(x1,y1, x2,y2, x3,y3) ).
Quest'ultima operazione è detta di rasterizing (rasterizzazione).
Visto che un engine 3d deve effettuare dei controlli su ogni pixel disegnato (siano di luce, di z buffering o qualunque altra cosa), non potremo servirci di un banale draw_triangle e dovremo costruirci una nostra funzione per determinare quali punti colorare.

Passiamo ad analizzare la View Matrix.

La matrice View sposta semplicemente i vertici dal world space al View Space. Quest'ultimo è uno spazio in cui l'origine coincide con la posizione della telecamera, ed
è orientato in modo da avvere l'asse Z parallelo al vettore che descrive la direzione in cui è rivolta la telecamera.
Questa trasformazione è molto comoda perché sposta la geometria del mondo in modo da renderla relativa alla telecamera, si può capire quanto ci semplifichi la ricerca delle coordinate a schermo.
Per poter procedere abbiamo bisogno di conoscere esattamente com'è posizionata la telecamera. Ci servono tre vettori:
FROM = [xfrom,yfrom,zfrom], TO = [xto,yto,zto], UP = [xup,yup,zup] (si noti la corrispondenza di argomenti con la funzione di Game Maker per gestire la telecamera)
FROM è il vettore posizionale che indica la locazione della telecamera nello spazio, TO indica invece il punto che la telecamera sta guardando.
Se un vertice si dovesse trovare in quel punto verrebbe disegnato al centro esatto dello schermo.
Conoscendo FROM e TO possiamo determinare un asse (parallelo al vettore TO-FROM) che sarà l'asse Z del sistema di riferimento del View Space.
sappiamo quindi dove si trova la telecamera e dove guarda, ma ancora non sappiamo in che modo lo fa. Infatti, non abbiamo imposto restrizioni sulla rotazione
che la telecamera può avere attorno all'asse prima considerato.
Mi sipego meglio: dovete puntare una telecamera ad un bel gruppetto di turisti giapponesi che vi ha chiesto di scattargli una foto davanti al colosseo, però scattando una foto "in verticale" non riuscite a includerli tutti.
Mantenendo costanti il punto in cui si trova la telecamera e il punto in cui guardate, ruotate allora la telecamera fino ad avere una foto orizzontale, più adatta alla situazione.
Avete portato a termine una rotazione di 90° attorno all'asse Z del View Space. Nel caso della telecamera serve qualche informazione che specifichi in che modo è orientata rispetto a Z.
Questo è esattamente il lavoro del vettore UP, un vettore direzionale che, se applicato nel punto FROM, indica che direzione ha lo zenith della telecamera.
Per chi non lo sapesse, lo zenith è considerato generalmente quell'asse perpendicolare alla Terra che passa per la nostra testa. Guardare in alto significa
guardare verso lo zenith.
A partire da questi tre vettori possiamo determinare una base ortonormale per il View Space:
Z_axis = normalize(TO-FROM)
X_axis = Z x normalize(UP)
Y_axis = Z x X

La view applica le seguenti trasformazioni ai vertici nel World Space:
traslazione di -FROM
rotazione di inversa di R (quindi R^-1), essendo R la matrice di rotazione che porta gli assi a coincidere con quelli dell'orientazione della telecamera.
Con (View * World) * Vertex abbiamo calcolato la posizione di Vertex relativa alla telecamera.

Immagine

Infine la matrice più complicata, la Projection Matrix.
Questa proietta i vertici nel View Space sul piano di proiezione, che corrisponde alla finesta del gioco.
Per fare questo abbiamo bisogno di alcuni parametri circa il tipo di proiezione che faremo.
In questa guida tratterò solo la rappresentazione per proiezione prospettica, quindi quello che ci serve è:
(horizontal) fov, aspect, nearclip, farclip.
Per capire meglio si immagini una piramide infinita, con vertice corrispondente alla posizione della telecamera, e con altezza parallela all'asse Z del View Space.
Ogni vertice posizionato all'interno di questa piramide può essere visto dalla telecamera.
Per descrivere la piramide servono i parametri già evidenziati:
hfov: l'angolo orizzontale di apertura della piramide, segnato nell'immagine come "fov".
aspect: è il ratio (una divisione) di height/width della schermata del rendering (probabilmente coincide con room_height/room_width)
near: è una distanza dalla telecamera. I punti con tale distanza inferiore a near saranno considerati troppo vicini per essere visti e non verranno disegnati.
Per quanto possa sembrare strano senza un near non si potrebbe fare una proiezione prospettica: tutti i punti andrebbero proiettati direttamente sulla telecamera
e non si capirebbe un bel niente!
far: similmente a near, i punti più lontani di far non verranno disegnati perché troppo lontani per essere visti.

Immagine

Il trapezio nero è in realtà quello che si vede sul piano XY della sezione di piramide che rappresenta il frustum di visualizzazione. Dall'origine (posizione della telecamera) parte una piramide che si prolunga all'inifnito di apertura fov.
L'asse di questa piramide coincide con l'asse Z del View Space (disegnato in nero). I valori near e far sono lunghezze misurate sull'asse della piramide
Immaginate un piano perpendicolare a questo asse, passante il punto appartenente all'asse e distante near dall'origine. La porzione di piano delimitata dalle intersezioni con i quattro lati laterali della frustum di visualizzazione viene chiamata Projection Plane, ed è un rettangolo avente come proporzioni l'aspect ratio specificato in precedenza.

Ora si immagini una nuova porzione di piano con le medesime caratteristiche del precedente, però passante per il punto
a distanza far dalla telecamera (e origine del View Space). Questa viene denominata Far Plane.

La frustum di visualizzazione non è altro che una sezione della piramide infinita di partenza, ovvero tutto quello che sta tra il near ed il far plane. Tutti i vertici che cadono dentro questo spazio vengono proiettati sul near plane.
Se prendessimo un nuovo sistema di riferimento con:
-> origine coincidente con il vertice in alto a sinistra del projection plane
-> asse X parallelo al lato più lungo (se esiste, ovvero se aspect ratio != 1) del projection plane
-> asse Y parallelo al lato più corto del projection plane e orientato verso il basso
avremo che le coordinate dell'intersezione del raggio che congiunge il vertice nel frustum di visualizzazione con la telecamera e il projection plane sono proporzionali alle coordinate finali del vertice rappresentato sullo schermo.

In altre parole: prendiamo tutti i vertici della scena, li trasportiamo lungo un percorso retillineo verso la telecamera. Quando questi vertici intercettano il projection plane, li fermiamo.
L'immagine che compare sul projection plane è esattamente l'immagine che volevamo ottenere, dobbiamo solo ridimensionarla in modo da farla combaciare con la finestra di gioco.

La projection matrix si occupa di questo, di ricavare le coordinate dei punti riportati sul projection plane, e come si può desumere dall'immagine si tratta di semplici conversioni lineari. Con un po di trigonometria potremmo arrivare a tradurre una cosa del genere in due trasformazioni per scale e translation.

Ringraziando di nuovo wikipedia, posto un'immagine che dovrebbe spiegare meglio

Image courtesy of Wikipedia

Questa immagine mette meglio in evidenza la piramide infinita, il near e far plane, e il solido al loro interno(colorato di verde): il frustum di visualizzazione.
La pallina A è completamente interna al frustum, pertanto verrà disegnata a schermo.
La pallina B, sebbene dentro alla piramide, non si trova all'interno del frustum e non verrà disegnata. Potremmo però aumentare il parametro far e arrivare a includere anche lei.
Per la pallina sigma (arancio) invece, non c'è santo che tenga. La telecamera non è orientata in modo da riuscire a vederla.

Xxshark888xX · Messaggio da **Xxshark888xX** » 28/02/2013, 21:49

Sla ha scritto:hai ragione, la trigonometria la metto domani, delle matrici parlerò dopodomani.
Da li il passo è veloce fino alle World View Projection

Si, ho capito tutto, si... sisi...

Sla · Messaggio da **Sla** » 28/02/2013, 21:54

Capirai quando ne parlerò. Se invece ti riferisci a qualcosa nell'op provo a spiegarlo meglio..

Solid Snake · Messaggio da **Solid Snake** » 28/02/2013, 22:49

Parlerai anche di collisioni in 3d?

Sla · Messaggio da **Sla** » 28/02/2013, 23:07

Non credo. Potrei farlo ma sarebbe puramente speculativo, nel senso che non si potrebbe apprezzare il collision checking in tempo reale visto che lato software non riuscirò a produrre nemmeno il rendering in tempo reale.
Il traguardo sarà riuscire a produrre un'immagine più o meno statica, ma di una scena poligonalmente complessa facendo tutto a mano.
Se avrò voglia di portare avanti il tutorial anche dopo questo primo traguardo credo riterrò più opportuno concentrarmi su aspetti grafici come effetti shader e simili.

Sla · Messaggio da **Sla** » 01/03/2013, 14:00

Sezione trigonometria completata

BaronVsCorsar · Messaggio da **BaronVsCorsar** » 01/03/2013, 16:55

una piccola precisazione sulla trigonomotria.
a rigore (e se ben ricordo è anche il comportamento in pratica del gml) la funzione degtorad
dovrebbe essere definita da R a R, e non nei due intervalli [0;360[ e [0;2pi[
(ma sicuramente non andrebbe definita con l'estremo superiore incluso nel caso lo si facesse limitatamente al primo periodo)

PS1: se non sbaglio non hai definito la simbologia dell'intervallo.

PS2: come hai realizzato le figure allegate in due colori? una tavoletta grafica?

PS3: sigillo del "baron approved" sul topic. non per mio interesse sul 3d, ma approcciare l'argomento matematicamente è lodevole! (e molto molto oneroso...)

Sla · Messaggio da **Sla** » 01/03/2013, 18:01

BaronVsCorsar ha scritto:la funzione degtorad
dovrebbe essere definita da R a R, e non nei due intervalli [0;360[ e [0;2pi[

Hai ragione, ma ho preferito lasciare così per consistenza con quanto disegnato prima (segmento e non retta), in modo da non confondere chi ancora deve imparare.
Inoltre non avevo ancora introdotto il concetto di "auto aggiustamento" degli angoli degeneri. Aggiungo comunque una nota a riguardo.

BaronVsCorsar ha scritto:PS1: se non sbaglio non hai definito la simbologia dell'intervallo.

provvedo, grazie per la segnalazione.

BaronVsCorsar ha scritto:PS2: come hai realizzato le figure allegate in due colori? una tavoletta grafica?

Precisamente. Forse un giorno la userò anche per far grafica, come pensavo quando l'ho presa

CaMpIoN · Messaggio da **CaMpIoN** » 03/03/2013, 6:41

Ottima idea Sla, in questo modo approfondisco anche un po di cose

Prometeo · Messaggio da **Prometeo** » 03/03/2013, 12:20

Sla, ti voglio bene... per gente come me, con un livello di matematica mooooolto imbarazzante, questi tutorial sono manna dal cielo... infinitamente grazie e chapeau

Sla · Messaggio da **Sla** » 04/03/2013, 19:57

Grazie per il vostro supporto, mi date la grinta per continuare

Pian piano sto portando avanti il lavoro

jumoonp · Messaggio da **jumoonp** » 04/03/2013, 23:53

Sla ha scritto:Grazie per il vostro supporto, mi date la grinta per continuare
Pian piano sto portando avanti il lavoro

Io ancora non riesco a capire come si fa a calcolare 2 lati di un triangolo scaleno, avendo come dati tutti e tre gli angoli ed un lato....

le formule che conosco vanno bene solo per il triangolo rettangolo... a causa di questo ho quasi rinuciato ad un progettino interessante

Sla · Messaggio da **Sla** » 05/03/2013, 0:13

hai letto la sezione trigonometria?

jumoonp · Messaggio da **jumoonp** » 05/03/2013, 22:56

Sla ha scritto:hai letto la sezione trigonometria?

Non ci capisco nulla....le mie basi matematiche sono quello che sono

CaMpIoN · Messaggio da **CaMpIoN** » 05/03/2013, 23:18

jumoonp ha scritto:
Sla ha scritto:Grazie per il vostro supporto, mi date la grinta per continuare
Pian piano sto portando avanti il lavoro
Io ancora non riesco a capire come si fa a calcolare 2 lati di un triangolo scaleno, avendo come dati tutti e tre gli angoli ed un lato....

le formule che conosco vanno bene solo per il triangolo rettangolo... a causa di questo ho quasi rinuciato ad un progettino interessante

Ti avevo spiegato come fare sulla tua domanda in D&R, avendo 3 angoli e 1 lato di un triangolo qualsiasi devi usare il teorema dei seni, leggiti la guida sulla trigonometria sopra di Sla magari ti è più chiaro.

Sla · Messaggio da **Sla** » 06/03/2013, 7:30

Se davvero non capisci nulla della parte di trigonometria non so come aiutarti, non ci sono grossi prerequisiti.
Prova ad essere più specifico. Potresti quotarmi la parte che non capisci

CaMpIoN · Messaggio da **CaMpIoN** » 08/03/2013, 22:06

Anche il resto delle operazioni verranno fatte con GM?
Altrimenti diventa un po' complicato ordinare il tutto se sono cose lunghine, comunque ottimo lavoro

Sla · Messaggio da **Sla** » 09/03/2013, 0:25

Certo, tutto con game maker. In un secondo momento proverò a rifare lo stesso programma ma ottimizzato e parallelizzato in più core in c++.
Vedremo la differenza

GameMaker Italia Forum

Parliamo di 3D

Parliamo di 3D

Re: Tecniche 3D - la realtà

Re: Tecniche 3D - la realtà

Re: Tecniche 3D - la realtà

Re: Tecniche 3D - la realtà

Re: Tecniche 3D - la realtà

Re: Tecniche 3D - la realtà

Re: Parliamo di 3D

Re: Parliamo di 3D

Re: Parliamo di 3D

Re: Parliamo di 3D

Re: Parliamo di 3D

Re: Parliamo di 3D

Re: Parliamo di 3D

Re: Parliamo di 3D

Re: Parliamo di 3D

Re: Parliamo di 3D

Re: Parliamo di 3D

Re: Parliamo di 3D

Re: Parliamo di 3D

Chi c’è in linea