You signed in with another tab or window. Reload to refresh your session.You signed out in another tab or window. Reload to refresh your session.You switched accounts on another tab or window. Reload to refresh your session.Dismiss alert
Transformar dataset em um dataframe. A função pd.read_csv() do pandas funciona com você passe diretamente uma url.
Para entender melhor
Digamos que você está fazendo algumas analises e, por qualquer motivo que seja, não quer baixar o arquivo. O pacote poderia ter um Mixin que integrasse algumas funções junto ao pandas.
Debate
Seria interessante debatermos isso, definirmos fluxo e outras coisas, pois podemos fazer várias novas funcionalidades a partir dessa integração, como:
Retornar um único DataFrame;
Retornar uma lista de DataFrames;
Retornar objetos que representam os atributos do dataset, para facilitar na decisão do que carregar direto na memória ou não;
etc.
The text was updated successfully, but these errors were encountered:
Concordo com a facilidade de integração com o pandas. Como você tem pensado na parte do código @alvarofpp ? Eu acho que se a gente adicionar a opção de transformar os datasets em dataframe como flags de funções já implementadas talvez essas funções podem ficar com muitas responsabilidades e confusas de dar manutenção no futuro
Acho que ao invés de flags, ficaria melhor criar funções mesmo. Talvez ate os dois, mas acho flag muito "escondido", além de já existirem muitas flags.
Concordo com @nymarya, o melhor seria uma função especifica para isso. O lance é que se você passar uma url no read_csv ele já transforma em DataFrame. Só precisaríamos de uma função que o primeiro argumento fosse url e qualquer coisa posterior fosse kwargs, que seriam os parâmetros do read_csv.
Usando url será que dá certo? Imaginei algo como um dataset para cada pacote, sendo que um pacote pode ter mais de um arquivo e cada arquivo tem uma url.
Pela experiência que tive usando URL, acho mais seguro usar depois de baixar. A API da PRF tem apresentado uns problemas ultimamente porque o pessoa muda muito as urls. Também já tive problema por querer usar a URL e não ter internet. Talvez uma alternativa de baixar ou não na hora, ou só baixar se tiver com a conexão OK.
Função
Transformar dataset em um dataframe. A função
pd.read_csv()
do pandas funciona com você passe diretamente uma url.Para entender melhor
Digamos que você está fazendo algumas analises e, por qualquer motivo que seja, não quer baixar o arquivo. O pacote poderia ter um Mixin que integrasse algumas funções junto ao pandas.
Debate
Seria interessante debatermos isso, definirmos fluxo e outras coisas, pois podemos fazer várias novas funcionalidades a partir dessa integração, como:
The text was updated successfully, but these errors were encountered: