<html xmlns:v="urn:schemas-microsoft-com:vml" xmlns:o="urn:schemas-microsoft-com:office:office" xmlns:w="urn:schemas-microsoft-com:office:word" xmlns:m="http://schemas.microsoft.com/office/2004/12/omml" xmlns="http://www.w3.org/TR/REC-html40"><head><meta http-equiv=Content-Type content="text/html; charset=utf-8"><meta name=Generator content="Microsoft Word 14 (filtered medium)"><style><!--
/* Font Definitions */
@font-face
        {font-family:Calibri;
        panose-1:2 15 5 2 2 2 4 3 2 4;}
@font-face
        {font-family:Tahoma;
        panose-1:2 11 6 4 3 5 4 4 2 4;}
/* Style Definitions */
p.MsoNormal, li.MsoNormal, div.MsoNormal
        {margin:0in;
        margin-bottom:.0001pt;
        font-size:12.0pt;
        font-family:"Times New Roman","serif";}
a:link, span.MsoHyperlink
        {mso-style-priority:99;
        color:blue;
        text-decoration:underline;}
a:visited, span.MsoHyperlinkFollowed
        {mso-style-priority:99;
        color:purple;
        text-decoration:underline;}
span.EmailStyle17
        {mso-style-type:personal-reply;
        font-family:"Calibri","sans-serif";
        color:#1F497D;}
.MsoChpDefault
        {mso-style-type:export-only;}
@page WordSection1
        {size:8.5in 11.0in;
        margin:1.0in 1.0in 1.0in 1.0in;}
div.WordSection1
        {page:WordSection1;}
--></style><!--[if gte mso 9]><xml>
<o:shapedefaults v:ext="edit" spidmax="1026" />
</xml><![endif]--><!--[if gte mso 9]><xml>
<o:shapelayout v:ext="edit">
<o:idmap v:ext="edit" data="1" />
</o:shapelayout></xml><![endif]--></head><body lang=EN-US link=blue vlink=purple><div class=WordSection1><p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";color:#1F497D'>I do know that 9 of the top 10 Green supercomputers have GPUs attached (8 of those are Nvidia GPUs and one is AMD).<o:p></o:p></span></p><p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";color:#1F497D'>The one without GPUs is not a CPU only system.  It has PEZY-SC coprocessors.<o:p></o:p></span></p><p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";color:#1F497D'><o:p> </o:p></span></p><p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";color:#1F497D'><a href="http://www.green500.org/lists/green201411">http://www.green500.org/lists/green201411</a><o:p></o:p></span></p><p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";color:#1F497D'><o:p> </o:p></span></p><p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";color:#1F497D'>The newest Nvidia GPUs (Maxwell architecture) have significantly lower power requirements than previous generations.<o:p></o:p></span></p><p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";color:#1F497D'>With high performance computing, you have to run your workloads to see if GPUs are the way to go.  If you are willing<o:p></o:p></span></p><p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";color:#1F497D'>to play with the code, most applications can be tweaked to run much faster on GPUs than on CPUs.<o:p></o:p></span></p><p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";color:#1F497D'><o:p> </o:p></span></p><p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";color:#1F497D'>The effort to program large parallel machines should not be underestimated.  But, it is the way of the future.<o:p></o:p></span></p><p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";color:#1F497D'>If you would like to try out GPU computing, Nvidia has a “free trial” offer at the moment.<o:p></o:p></span></p><p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";color:#1F497D'><a href="http://www.nvidia.com/object/gpu-test-drive.html?2">http://www.nvidia.com/object/gpu-test-drive.html?2</a><o:p></o:p></span></p><p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";color:#1F497D'><o:p> </o:p></span></p><p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";color:#1F497D'><o:p> </o:p></span></p><p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";color:#1F497D'>---> Paul<o:p></o:p></span></p><p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";color:#1F497D'><o:p> </o:p></span></p><p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";color:#1F497D'><o:p> </o:p></span></p><p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";color:#1F497D'><o:p> </o:p></span></p><p class=MsoNormal><b><span style='font-size:10.0pt;font-family:"Tahoma","sans-serif"'>From:</span></b><span style='font-size:10.0pt;font-family:"Tahoma","sans-serif"'> TriEmbed [mailto:triembed-bounces@triembed.org] <b>On Behalf Of </b>Nathan Yinger<br><b>Sent:</b> Friday, February 06, 2015 5:02 PM<br><b>Cc:</b> TriEmbed<br><b>Subject:</b> Re: [TriEmbed] Personal supercomputing<o:p></o:p></span></p><p class=MsoNormal><o:p> </o:p></p><div><div><div><div><p class=MsoNormal style='margin-bottom:12.0pt'>Bitcoin miners have collected a fair number of performance comparisons for SHA1 hashes (<a href="https://en.bitcoin.it/wiki/Non-specialized_hardware_comparison#CPUs.2FAPUs">https://en.bitcoin.it/wiki/Non-specialized_hardware_comparison#CPUs.2FAPUs</a>). Just from skimming there doesn't seem to be a big difference in energy efficiency, but there is a big difference in capacity.<o:p></o:p></p></div><div><p class=MsoNormal>What sort of time frame are you looking at? Depending on when you get 'sufficient experience', the costs could be very different. Also, the ease of development for FPGAs could change. I'm not knowledgeable, but I saw Adafruit selling an FPGA development board, so it looks like at least some barriers are coming down there.<o:p></o:p></p></div><p class=MsoNormal><o:p> </o:p></p></div><p class=MsoNormal style='margin-bottom:12.0pt'>Incidentally, I experimented with doing bitcoin mining during winters, but it seemed to increase my energy bill over the previous year. I don't know if that was the mining or because of the weather though.<o:p></o:p></p></div><p class=MsoNormal>~Nathan<o:p></o:p></p></div><div><p class=MsoNormal><o:p> </o:p></p><div><p class=MsoNormal>On Thu, Feb 5, 2015 at 1:13 PM, Charles West <<a href="mailto:crwest@ncsu.edu" target="_blank">crwest@ncsu.edu</a>> wrote:<o:p></o:p></p><div><div><div><div><p class=MsoNormal style='margin-bottom:12.0pt'>Hello,<o:p></o:p></p></div><p class=MsoNormal style='margin-bottom:12.0pt'>I'm looking into machine learning and it seems like some of the methods could potentially just keep getting better the more data/computational power you throw at them.  I'm not really skilled enough to do to much with them yet, but I wanted to go ahead and see what sort of setup it might be good to build once I have sufficient experience in the area.<o:p></o:p></p></div><p class=MsoNormal style='margin-bottom:12.0pt'>Wikipedia has a list of the most power/price computers in the world (<a href="http://en.wikipedia.org/wiki/Flops" target="_blank">http://en.wikipedia.org/wiki/Flops</a>).  It is interesting to note that the last two entries are made from commodity PC parts (the latest coming in at $902.57 and delivering 11.5 TFLOPS).  It would seem that one way to go would be just build one of these servers with a top of the line GPU.<o:p></o:p></p></div><div><p class=MsoNormal style='margin-bottom:12.0pt'>The complicating factor is that the GPU is really power hungry and takes something like > .5 kilowatts to keep running.  At normal utility rates, this means that power is going to cost more than the system if it is kept operating continuously for more than a year.<o:p></o:p></p></div><div><p class=MsoNormal style='margin-bottom:12.0pt'>The other possible alternatives are building large clusters of Odroid C1s or Raspberry Pi 2.0s, each of which have quadcore arm processors and only take ~2.5 watts to run (equivalent power at 200 units).  At the same time, you could probably only have about 18 units at equivalent cost not counting energy.<o:p></o:p></p></div><div><p class=MsoNormal style='margin-bottom:12.0pt'>Lastly, you could just build a decked out CPU server.  I don't really know how they clock in in terms of power efficiency.<o:p></o:p></p></div><div><p class=MsoNormal style='margin-bottom:12.0pt'>A few questions:<br><br>What would you build if you had something that would happily eat as many parallel flops as you could deliver (with correspondingly increasing performance)?<o:p></o:p></p></div><div><p class=MsoNormal>Does anyone know how GPUs compare to CPUs in terms of power consumption per FLOP?<br><br>At what point does the power cost dominate the computer cost (timescale, hours of expected operation, etc)?  <br><br>Also, should this be our new standard way to heat the house during the winter?<o:p></o:p></p></div><div><p class=MsoNormal><o:p> </o:p></p></div><div><p class=MsoNormal>Thanks,<o:p></o:p></p></div><div><p class=MsoNormal>Charlie West<o:p></o:p></p></div><div><p class=MsoNormal style='margin-bottom:12.0pt'><o:p> </o:p></p></div></div><p class=MsoNormal style='margin-bottom:12.0pt'><br>_______________________________________________<br>Triangle, NC Embedded Computing mailing list<br><a href="mailto:TriEmbed@triembed.org">TriEmbed@triembed.org</a><br><a href="http://mail.triembed.org/mailman/listinfo/triembed_triembed.org" target="_blank">http://mail.triembed.org/mailman/listinfo/triembed_triembed.org</a><br>TriEmbed web site: <a href="http://TriEmbed.org" target="_blank">http://TriEmbed.org</a><o:p></o:p></p></div><p class=MsoNormal><o:p> </o:p></p></div></div></body></html>