<html><head><meta http-equiv="Content-Type" content="text/html charset=us-ascii"></head><body style="word-wrap: break-word; -webkit-nbsp-mode: space; -webkit-line-break: after-white-space; ">Hi everyone,<div><br></div><div>I would like to ask for a advice in making open some research data. I'm submitting a paper next week or so and want to make the data available in the web. We're considering several options and I'd like ask your opinion about them.  </div><div><br></div><div>To put it in perspective:</div><div><br></div><div>- Raw data consist of around 1GB of text files. Files are small, but there are several hundreds of them organized in different directories.</div><div>- Raw data files can be understood by humans (just CSV files), but we have Python scripts that process the whole directory structure to filter values and make new files that you can plot directly with your favorite tool. These scripts are in a GitHub repo already.</div><div>- We might add more data in the future, for example, new parameter sets, although this is not essential.</div><div>- We want to give people the chance to do new plots with our data easily, e.g. plotting a different quantity or range of parameters that's not in the paper.</div><div>- We will have two types of users: people that can program, use version control and install software (say intermediate Software Carpentry students), and others which may never heard about some of these tools.</div><div>- We will post the preprint in the arXiv.</div><div>- We're looking for something relatively easy to setup.</div><div><br></div><div>Where we are:</div><div><br></div><div>- Our first option is to do a public GitHub repo, put everything in there as it's in our clusters, and add a iPython notebook that uses our scripts to reproduce the plots in our paper. Users can clone, pip install our scripts, and modify our notebook to do a different plot using our data. The pros for this is that we know how to use all the tools. The cons is that we need to display the notebook somewhere else for our novice users, maybe with nbviewer, and that the github repo doesn't have a doi.</div><div>- Wakari could be an alternative for interacting with the notebook, but I understand that does not read directly from the GitHub repo.</div><div>- I've heard about Figshare, which looks good, but don't know exactly how it works, in particular whether people can interact easily with the data. Any experience with that? </div><div>- What about a combination of Figshare and a Github repo? What about Fidgit [1]? </div><div><br></div><div><br></div><div>Best,</div><div><br></div><div>Ivan</div><div><br></div><div>[1]  <a href="https://github.com/arfon/fidgit">https://github.com/arfon/fidgit</a></div></body></html>