Thursday, 24 August 2017

Fpga Trading Sistemi


in-FPGA8482 Trading Systems ridurre la latenza commercio 16 settembre 2010 risposta commerciale latenza Prima pubblicazione ridotto a meno di due microsecondi combinando NASDAQ prurito e il OUCH in un unico FPGA David Buechner, Vice Presidente, Impulse: strumenti Impulse sono in uso presso le principali imprese finanziarie e di copertura fondi in cui hanno matematici attrezzate e sviluppatori di algoritmi per migliorare drasticamente la latenza. in-FPGAtrade Trading Systems (infpga) hanno annunciato un progetto di riferimento trading automatico con accelerazione hardware che esegue NASDAQ ITCH trattamento di alimentazione e l'ordine OUCH uscita entrata in esecuzione su 10Gb Ethernet, con meno di due microsecondi di latenza. Il sistema deve essere mostrato al High Performance Computing Mercati finanziari Show 2010 e conferenze, stand 424, a New York City il 20 settembre 2010. La in-FPGA sistema ha lo scopo di consentire agli operatori di raggiungere latenze di risposta che sono una frazione di quello può essere realizzato utilizzando sistemi basati su CPU. I visitatori della mostra sarà in grado di vedere l'hardware effettivamente utilizzato per la decodifica dei dati di mercato e immissione di ordini in uscita, con tutte le funzionalità eseguiti interamente in alta prestazioni Field Programmable Gate Array (FPGA) logica. Il sistema risultante è detto per ottenere sub latenza 2-microsecondi oggi, con miglioramenti attesi in un throughput stati fatti per tutto il 2010. Queste piattaforme di riferimento basati su FPGA hanno lo scopo di operare a diverse volte la velocità del server microprocessore più grandi. Tutti i suoi circa la latenza di trading, ha detto Cameron Elliott, capo progettista del sistema in-FPGA. di trading basato su FPGA in grado di rispondere ai dati di mercato di un ordine di grandezza più veloce rispetto ai server basati su Linux, e 2-5 volte più veloce rispetto ai sistemi ibridi CPUFPGA. Gran parte del guadagno viene da semplificare il percorso hardware, il consolidamento di elaborazione su un unico chip hardware ed eliminando i percorsi ad elevata latenza. Ciò che rende questo più eccitante per i commercianti è che possono implementare la loro logica di trigger commercio in linguaggio C utilizzando Impulse C, piuttosto che dover imparare descrizione hardware linguaggi come Verilog o VHDL, o di dover passare i loro modelli off per ingegneri hardware per la traduzione . strumenti Impulse sono in uso presso le principali imprese finanziarie e hedge fund dove sono attrezzati i matematici e gli sviluppatori di algoritmi per migliorare drasticamente la latenza. in-FPGA sistema commerciale e l'applicazione di riferimento consente agli sviluppatori di software per utilizzare l'accelerazione hardware per l'elaborazione 10Gb Ethernet, ha detto David Buechner, Vice Presidente di Impulse. Questo offre una tecnologia dirompente per le imprese commerciali che vogliono essere il primo in coda con i loro commerci. Articoli popolari Preqin lancia la soluzione di gestione del portafoglio Thomson Reuters Labs apre a Singapore Wall Street Blockchain Alliance aggiunge Blockchain Intelligence Group in qualità di membro aziendale R. J. OBrien limitata seleziona BSO per la connettività BT si collega cinque maggiori mercati FX LiquidityBook aggiunge tre fondi hedge a piattaforma POESIE Copyright copia Automated Trader Ltd 2017 - strategie di conformità TechnologyI aver letto su diverse implementazioni di sistemi HFT su FPGA. La mia domanda è, quale parte dei sistemi HFT sono per lo più implementato su FPGA giorno d'oggi sono FPGA ancora molto popolare è solo il gestore di alimentazione implementata sulle FPGA Poiché alcuni di questi sistemi sopra descritti solo hanno un gestore di alimentazione implementato su FPGA, perché i cambiamenti di strategia troppo, o è troppo difficile da implementare su FPGA. Altri sostengono che essi hanno anche implementato strategie di trading su FPGA o utilizzando schede di rete ad alte prestazioni, invece di FPGA per costruire sistemi HFT. Ho letto sui diversi approcci, ma trovo difficile per confrontare come la maggior parte dei risultati sono testati su diversi set di input. chiesto 9 marzo 14 a 21:06 Ecco un modo per pensare a questo proposito: immaginate che si può fare qualcosa in un ASIC (cioè direttamente in hardware). Tuttavia, il processo di fabbricazione è di per sé costoso, e si ottiene un disegno che non è possibile modificare in seguito. ASIC hanno senso per le attività predefinite come Bitcoin minerario, ben noti algoritmi di elaborazione dati, ecc D'altra parte abbiamo CPU ordinarie (così come CPU coprocessore e GPU), che sono di uso generale, ma elaborano un piccolo (in termini di istruzioni simultanee) insieme di istruzioni ad una velocità molto elevata. FPGA sono la terra di mezzo. Sono emulatori hardware e come tali possono essere considerate 10 volte più lento di hardware vero e proprio, ma ancora modo più performante per le operazioni simultanee di CPU a condizione che siano in grado di utilizzare il dado a diffondere la logica conseguenza. Alcuni usi di FPGA sono: Video transcodifica (ad esempio, la decodifica video HD nei televisori), così come varie schede di acquisizione dati fissi di struttura dei dati di analisi (Regex parsing) di simulazione del sistema discreta (per esempio, simulare il risultato di un gioco di carte) Un sacco di adeguatamente incorporato applicazioni come ad esempio nel settore aerospaziale o la ricerca scientifica Il problema con FPGA per quant utilizza è che la sua non è così buono per i calcoli in virgola mobile, tanto più che le CPU ordinarie sono già ottimizzate per quella con le cose come SIMD. Tuttavia, per qualsiasi cosa a punto fisso o strutture di dati di dimensione fissa, progettazione FPGA consente di configurare il dispositivo per fare un sacco di trasformazione, allo stesso tempo. Alcune cose fatte in commercio utilizzano FPGA per i gestori di alimentazione (analisi direttamente dal flusso di rete), così come la costruzione di alcune parti della struttura commerciale (ad esempio, ordini) in hardware in modo da essere in grado di affrontare la rapida evoluzione struttura dati senza caricamento della CPU. FPGA mirano principalmente per affrontare il problema del trattamento dei dati in modo rapido senza pagare i costi di propagazione. Ciò è particolarmente in contrasto con dispositivi come GPGPU (o qualsiasi scheda PCI-dimora, come Xeon Phi) che pagano le sanzioni prestazioni per ottenere i dati tofrom il dispositivo. Detto questo, le opzioni DMA stanno migliorando in questo senso, anche. FPGA sono davvero niente di più che gli stessi blocchi logici ripetute più e più volte durante il silicio, con gli switch configurabili per collegare i blocchi logici insieme. Questo rende FPGA molto buona - e veloce - a trattare con problemi ripetitivi che possono essere descritte in un circuito hardware che non cambia durante il funzionamento. E si può avere letteralmente migliaia o decine di migliaia di questi circuiti, tutti operanti in parallelo allo stesso tempo, in un FPGA. CPU invece si basano sul ALU, che carica istruzioni, carica i dati, opera sui dati, forse memorizza i risultati, e poi fa tutto da capo. CPU quindi sono molto buone - e veloce - a trattare con i problemi che sono in continua evoluzione - sia in termini di dimensioni e di portata e al passaggio tra i diversi compiti. Oggi CPU o nucleo dovranno decine a centinaia di ALU con pipeline parallele per dati e istruzioni, che li rende molto veloce a problemi complessi che possono essere elaborate in parallelo. Questi disegni fanno FPGA più veloce a problemi più semplici che possono essere attaccati con una vasta architettura parallela - come la condensa verso il basso più feed di dati in meno di micro-secondo, filo-filo, o innescando un pre-calcolata acquistare, vendere o annullare su un prezzo che corrisponde a un modello particolare. Le CPU sono più veloci a problemi più complessi che richiedono meno il parallelismo, come ad esempio il calcolo del paniere di acquisti, vende e cancella necessario per mantenere un portafoglio aggiustato per il rischio o l'integrazione di una serie di prezzo e di notizie fonti di varia età e la qualità in indicatori di trading utilizzate dai i commercianti e la gestione di decidere quali aggiustamenti faranno al sistema commerciale. Dove FPGA sono utilizzati in HFT dipende molto l'architettura del negozio particolare. Essi sono i più utilizzati eseguendo semplici, ripetitivi compiti ampi e li esegue rapidamente. Le CPU sono un coltellino svizzero che può fare più nulla, soprattutto quando le esigenze cambiano e le dimensioni del problema non sono pienamente compresi in via preliminare. risposto 11 marzo 14 alle 17:10 La tua domanda fa davvero non ha molto senso. E 'come chiedere quanto del cablaggio in infrastrutture di negoziazione si avvale fibra ottica e quanto di esso utilizza il rame. La migliore risposta che possiamo dare a voi è che un FPGA non è una bacchetta magica. Si tratta di una interpretazione non corretta di carta bianca Ciscos. Theres molto poco sovrapposizione tra i casi d'uso di switching fabric e quelli di un FPGA. quale parte dei sistemi HFT sono per lo più implementati su FPGA oggi Attualmente, gli FPGA sono spesso utilizzati nelle nostre stampanti e TV set-top box. Risposi 9 marzo 14 alle 21:55 voglio sottolineare il Digital Signal Processing (DSP) bloccare con ALU. Di oggi FPGA hanno centinaia di blocchi programmabili DSP i molto più grandi avere migliaia. Ora, improvvisamente, si dispone di migliaia di piccoli processori a vostra disposizione, tutti in grado di eseguire calcoli in parallelo. Questo è di gran lunga al di sopra di parallelismo fornito dal Xeon Phi o GPU. Infatti, se stai facendo modellazione opzioni di prezzo o di modellazione del rischio stocastico su FPGA, è possibile ottenere aumento di più di 100 volte in termini di prestazioni rispetto alle ultime GPU e ancora di più rispetto alle ultime CPU. Insieme con i blocchi DSP, l'altro fattore importante in questo aumento di prestazioni è la memoria cache. FPGA è dotato di RAM distribuita che è estremamente veloce, consentendo la larghezza di banda di 100TBs da raggiungere a livello di unità di elaborazione. L'utilizzo di oggi FPGA per algo strategie dà grandi e massicciamente concomitante di risorse di calcolo che è in grado di dare da 100 a 1000 volte maggiore in termini di prestazioni rispetto alle GPU o CPU. L'avvertenza principale è che si dovrebbe avere per diventare esperti in forma scritta in Verilog o VHDL :) Sanjay Shah CTO Nanospeed risposto 5 Agosto 14 at 18:05 Una varietà di processori potenti, many-core stanno cominciando a farsi strada nel l'hardware spazio di accelerazione che è stato precedentemente completamente di proprietà di FPGA. Aziende come Tilera, Adapteva, e coerente Logix prevedono tutti questi processori qui negli Stati Uniti, con Enyx dalla Francia anche fare incursioni. La vera misura di efficacia di questi processori massicciamente paralleli risiede nella maturità dei loro strumenti software. Quello in cui l'utente potenziale dovrebbe concentrarsi la loro attenzione. Nessuno vuole programmare o decine di debug o centinaia di core utilizzando tecniche manuali. Naturalmente, va da sé che la larghezza di banda IO è importante. Nella mia esperienza personale in questo spazio Im vedendo l'adozione di processori cliente coerente Logix come co-processori o acceleratori hardware per l'accelerazione algo C-lingua. Godendo il ciclo di progettazione rapida di un ambiente basato C, i programmatori algo possono modificare il codice per il loro contenuto cuori e non preoccuparsi di costoso e richiede tempo HDL intensivo di codifica per FPGA. Il partizionamento ottimale è quella di avere FPGA fare quello che sanno fare meglio - fissa le operazioni ripetitive - e hanno processori many-core fanno quello che sanno fare meglio: accelerare gli sviluppatori algo produttività e la velocità di esecuzione. John Irza, Business Development Manager, Coherent Logix, Inc. risposto 6 agosto 14 alle 00:42 Quasi tutti i negozi HFT utilizzare l'architettura FPGA. Questi dispositivi devono essere sostituite frequentemente come la fretta sono superato dai più recenti miglioramenti nella velocità, condutture, il parallelismo, ecc A meno che non si è pronti ad investire 2M un anno, a capire un'altra strategia. Sacco di ragazzi che fanno mosse quotidiane di prezzo con carta e penna stanno facendo miliardi a Omaha, NB. risposto 28 Luglio 16 in 10:31 tua risposta 2017 Stack Exchange, IncArgon design un FPGA base HFT piattaforma in un comunicato stampa di oggi Argon Design presso Cambridge nel Regno Unito hanno annunciato ciò che essi descrivono come: Un sistema di trading ad alte prestazioni utilizzando un mix eterogeneo di tecnologie per ridurre al minimo la latenza di trading. Il mix di tecnologie è fornito dal loro uso dell'interruttore di applicazione Arista Networks 7124FX che: include un FPGA Altera con accesso a livello hardware per 8 delle sue porte 10 Gb Ethernet 24 e un dominio x86 basati su processori Xeon di Intel. Secondo project039s 034case studiare 034 sul sito web Argon, hanno: sviluppato un prototipo di sistema dove l'analisi feed di dati di mercato e di esecuzione delle negoziazioni in rapido percorso viene eseguita direttamente sullo switch secondo le regole stabilite in parallelo su processori tradizionali. l'accesso diretto consente FPGA feed di dati da analizzare e analizzato il più vicino possibile ai gestori di alimentazione. Allo stesso modo il mix del processore eterogenea nello switch abilita altre funzioni correlate da intraprendere e gli ordini eseguiti di nuovo sul filo. Schierato in CoLo alle sedi di negoziazione come parte del giorno per giorno mix di tecnologia presente oggi nei rack questa tecnologia può prendere il design e le prestazioni della funzione di negoziazione a un livello superiore di prestazioni. Argon hanno quantificato questo livello 034higher di performance034 da: Utilizzando il cablaggio test sviluppato per il programma comunitario Finteligent Trading, la latenza misurata è stata ridotta di un fattore pari a 25 rispetto ai modelli x86 puri testati dal programma. Per la gamba misurata nel test harness, la latenza è stata ridotta da una precedente migliore di 4,600ns a 176ns per traffici generati algoritmicamente eseguiti al mercato simulato. Il miglioramento delle prestazioni è stato ottenuto fornendo un facile-percorso in cui le operazioni sono eseguite direttamente dalla FPGA sotto il controllo di regole di trigger elaborati dalle funzioni x86. La latenza è ridotta ulteriormente da due ulteriori tecniche nel parsing FPGA in linea e prelazione. Poiché i dati di mercato entra l'interruttore, il frame Ethernet viene analizzato in serie come bit arrivano permettendo informazioni parziali da estrarre e abbinati prima che è stata ricevuta l'intera struttura. Quindi, invece di attendere la fine di un potenziale innesco pacchetto di ingresso, prelazione viene utilizzato per inviare la parte aerea di una risposta che contiene l'Ethernet, IP, TCP e FIX intestazioni. Questo permette il completamento di un ordine in uscita quasi immediatamente dopo la fine del trigger pacchetto mangimi mercato. L'effetto complessivo è una drastica riduzione della latenza per chiudere al minimo che è teoricamente possibile. Here039s un video Argon hanno prodotto che mostra le prestazioni il loro prototipo system039s essere valutata utilizzando il test harness Finteligent: Se si ascolta attentamente si nota che Argon affermano che: L'interruttore rende ordini di mercato sulla base di informazioni di mercato con l'estremità di un pacchetto di risposta alla fine del pacchetto tempi di circa 170 ns. In base a tale comunicato stampa, ancora una volta, Arista039s direttore regionale per i servizi finanziari Paul Goodridge ha commentato che: Questo è esattamente il tipo di applicazione pratica stiamo cercando di vedere dal mercato con il nostro prodotto 7124FX e siamo felici e impressionato con Argon Designs impegno e approccio. Questa joint venture esemplifica Aristas innovazione e evidenzia ulteriormente il valore reale di Aristas EOS (Extensible Operating System) e la sua capacità di prendere programmabilità al mercato di commutazione Ethernet. I039ve ora è riuscito a parlare con Paolo, e gli ho chiesto che programmabilità. Come suggerito dalla scheda 7124FX, EOS è essenzialmente al largo della piattaforma x86 Fedora 14 Linux, ma una buona conoscenza di Verilog sarà utile se si scopre che è necessario programmare il FPGA stesso. Quando ho chiesto i sistemi di sviluppo Paul ha suggerito un buon primo passo sarebbe quello di entrare in possesso di un Altera Stratix III o IV kit di sviluppo, che sono più facilmente disponibili e anche un sacco più conveniente di un 7124FX In conclusione ho chiesto Paul se c'era qualcosa he039d desidera aggiungere a quello che he039d detto nel comunicato stampa Argon. Egli ha sottolineato: Arista039s concentrano sul potenziamento dei nostri clienti, e le prestazioni deterministiche dei nostri interruttori. Sembra che con sarà presto avere il potere di un minimo di programmazione aggiuntiva clienti Arista039s per iniziare deterministico trading ad alta frequenza a velocità prossime a quella della luce l'unico inconveniente è, naturalmente, che il prezzo di questo tipo di kit è abbastanza astronomico troppo. Aggiornamento - Argon disegno hanno gentilmente ci ha fornito questo white paper per voi a leggere a vostro piacimento

No comments:

Post a Comment