Cache P2P - P2P caching

Cache ponto a ponto ( cache P2P ) é uma tecnologia de gerenciamento de tráfego de rede de computador usada por Provedores de Serviços de Internet (ISPs) para acelerar o conteúdo entregue em redes ponto a ponto (P2P) enquanto reduz os custos de largura de banda relacionados.

O cache P2P é, em princípio, semelhante ao cache de conteúdo usado há muito tempo pelos ISPs para acelerar o conteúdo da Web ( HTTP ). O cache P2P armazena temporariamente conteúdo popular que está fluindo para a rede de um ISP. Se o conteúdo solicitado por um assinante estiver disponível em um cache, o cache satisfaz a solicitação de seu armazenamento temporário, eliminando a transferência de dados por links de trânsito caros e reduzindo o congestionamento da rede . Esta abordagem pode fazer com que os ISPs violem as leis, pois os sistemas P2P compartilham arquivos que infringem direitos autorais em partes significativas.

O conteúdo P2P responde bem ao armazenamento em cache porque tem altos padrões de reutilização que refletem uma distribuição semelhante à do Zipf . Comunidades P2P têm diferentes parâmetros do Zipf que determinam qual fração de arquivos é solicitada várias vezes. Por exemplo, uma comunidade P2P pode solicitar 75% do conteúdo várias vezes, enquanto outra pode solicitar apenas 10%.

Alguns dispositivos de cache P2P também podem acelerar o tráfego de streaming de vídeo HTTP do YouTube , Facebook , RapidShare , MegaUpload , Google , AOL Video , MySpace e outros sites de compartilhamento de vídeo na web.

Como funciona o cache P2P

O cache P2P envolve a criação de um cache ou espaço de armazenamento temporário para dados P2P, usando hardware de comunicação especializado, armazenamento em disco e software associado. Esse cache é colocado na rede do ISP, co-localizado com os links de trânsito da Internet ou colocado em pontos de agregação chave ou em cada extremidade do cabo.

Depois que um cache P2P é estabelecido, a rede redireciona de forma transparente o tráfego P2P para o cache, que serve o arquivo diretamente ou passa a solicitação para um usuário P2P remoto e simultaneamente armazena em cache esses dados para o próximo usuário. Até que ponto o cache é benéfico depende de quão semelhantes são os interesses de conteúdo dos clientes do ISP. Devido ao número relativamente pequeno de conteúdo compartilhado em sistemas P2P (em comparação com a Web) e os interesses semânticos, geográficos e organizacionais da proporção de compartilhamento dos usuários em P2P podem ser significativamente maiores do que o cache HTTP / Web.

O cache P2P normalmente funciona com uma tecnologia de redução de tráfego de rede chamada Deep Packet Inspection (DPI). A tecnologia DPI é usada por provedores de serviço para entender qual tráfego está sendo executado em suas redes e para separá-lo e tratá-lo para a entrega mais eficiente. Os produtos DPI identificam e passam pacotes P2P para o sistema de cache P2P para que ele possa armazenar em cache o tráfego e acelerá-lo.

A Peerapp Ltd. detém a primeira patente para a tecnologia de cache P2P, que foi registrada em 2000.

O problema da largura de banda P2P

Em 2008, o tráfego ponto a ponto foi estimado em 50% de todo o tráfego da Internet e deve quadruplicar entre 2008 e 2013, atingindo 3,3 exabytes por mês - ou o equivalente a 500 milhões de DVDs por mês. No entanto, esta tendência foi interrompida, visto que em 2016 o tráfego P2P global começou a diminuir, apresentando uma descida de 6% entre 2016 e 2021. Estas estatísticas podem ser explicadas pela popularização dos serviços de Video on Demand , que têm (até o momento) usou uma arquitetura centralizada para distribuição de dados.

O aumento do tráfego P2P criou problemas para os ISPs. As redes podem ficar saturadas com tráfego P2P, criando congestionamento para outros tipos de uso da Internet. O custo do tráfego P2P é desproporcional à quantidade de receita que os ISPs obtêm desses clientes por causa dos pacotes de largura de banda normalmente vendidos. Para evitar que o tráfego P2P prejudique o serviço para todos os assinantes, os ISPs geralmente enfrentam três opções:

  • Invista em largura de banda e equipamentos adicionais. Infelizmente, aumentar a largura de banda muitas vezes não resolve o problema, porque os aplicativos P2P tendem inerentemente a consumir tanta largura de banda quanto disponível.
  • Implemente limites de byte, políticas ou modelagem de tráfego P2P mais rígidos , limitando a velocidade do tráfego P2P. A dificuldade é que os pacotes P2P estão se tornando cada vez mais difíceis de identificar, especialmente com a introdução da criptografia (como a criptografia do protocolo BitTorrent ). A modelagem de tráfego também pode gerar publicidade negativa e reações do cliente.
  • Implemente uma forma de cache P2P.

O cache libera a demanda de largura de banda em links críticos da Internet e melhora a experiência para todos os usuários - usuários P2P cujo compartilhamento de arquivos é aprimorado com o uso do cache e usuários não P2P que experimentam melhor desempenho em redes não congestionadas pelo tráfego P2P.

Os primeiros a adotar o cache P2P foram os ISPs na Ásia, Pacífico, América Latina, Caribe e Oriente Médio, cujos assinantes são grandes usuários de redes P2P e onde fornecer largura de banda adicional para lidar com dados P2P é muito caro devido ao despesas de ligações de trânsito internacional.

Espera-se que o cache P2P se torne uma tecnologia cada vez mais essencial para ISPs e MSOs (operadores de sistemas múltiplos) em todo o mundo, particularmente com a crescente popularidade do conteúdo P2P entre assinantes de banda larga e a adoção de P2P como estratégia de distribuição de conteúdo por provedores de conteúdo convencionais, como BBC .

Implementações de cache P2P

  • Software de cache de mídia PeerApp UltraBand [1]
  • Corelli é um sistema de cache P2P baseado na comunidade que opera de forma descentralizada em vários pares. Isso permite que um serviço de cache seja realizado em ambientes que não possuem uma infraestrutura de cache fixa, por exemplo, uma rede ad hoc sem fio .
  • Community Caching é uma solução de caching distribuída e voltada para o interesse da comunidade P2P para sistemas P2P estruturados (baseados em DHT). Ele alivia a sobrecarga devido ao isolamento de comunidades P2P e perda de popularidade de conteúdo devido à agregação de conteúdo de várias comunidades.

Fontes

  1. ^ Jacob, Assaf M .; Zoe Argento (1 de setembro de 2010). "Armazenar ou não armazenar em cache - essa é a questão; P2P 'Cache do sistema' - O dilema de direitos autorais". Revisão da Lei de Whittier . 31 : 421-. SSRN   1670289 .
  2. ^ Sripanidkulchai, K. "A popularidade das consultas Gnutella e suas implicações na escalabilidade" . Página visitada em 6 de janeiro de 2012 .
  3. ^ Klemm, A .; C. Lindemann; MK Vernon ; OP Waldhorst (2004). Caracterizar o comportamento da consulta em sistemas de compartilhamento de arquivos ponto a ponto (PDF) . 4ª ACM SIGCOMM Conf. em medição pela Internet.
  4. ^ a b c d Bandara, HMN Dilum; AP Jayasumana (junho de 2011). Explorando comunidades para melhorar o desempenho de pesquisa em sistemas P2P estruturados . IEEE Int. Conf. em Comunicações (ICC '11). doi : 10.1109 / icc.2011.5962882 .
  5. ^ "Cópia arquivada" . Arquivado do original em 09/06/2010 . Página visitada em 2010-05-23 . CS1 maint: cópia arquivada como título ( link )
  6. ^ Patente dos EUA Número 7.203.741 B2
  7. ^ Cisco. "Aproximando-se da Era Zettabyte" . Cisco . Página visitada em 6 de janeiro de 2012 .
  8. ^ Cisco. "Cisco Visual Networking Index: Forecast and Methodology, 2016–2021" . Cisco . Retirado em 17 de agosto de 2018 .
  9. ^ Gareth Tyson, Andreas Mauthe, Sebastian Kaune, Mu Mu e Thomas Plagemann. Corelli: Um serviço de replicação dinâmica ponto a ponto para oferecer suporte a conteúdo dependente de latência em redes comunitárias. "Cópia arquivada" (PDF) . Arquivado do original (PDF) em 18/06/2015 . Retirado 2012-04-26 . CS1 maint: cópia arquivada como título ( link )