.pf{position:relative;background-color:#fff;overflow:hidden;margin:0;border:0}.pc{position:absolute;border:0;padding:0;margin:0;top:0;left:0;width:100%;height:100%;overflow:hidden;display:block;transform-origin:0 0;-ms-transform-origin:0 0;-webkit-transform-origin:0 0}.bi{position:absolute;border:0;margin:0}.t{position:absolute;white-space:pre;font-size:1px;transform-origin:0 100%;-ms-transform-origin:0 100%;-webkit-transform-origin:0 100%;unicode-bidi:bidi-override;-moz-font-feature-settings:"liga" 0}.t:after{content:''}.t:before{content:'';display:inline-block}.t span{position:relative;unicode-bidi:bidi-override}._{display:inline-block;color:transparent;z-index:-1}.pi{display:none}@media screen{.pf{margin:13px auto;box-shadow:1px 1px 3px 1px #333;border-collapse:separate}}.ff1{font-family:ff1;line-height:.895996;font-style:normal;font-weight:400;visibility:visible}.ff2{font-family:ff2;line-height:.861816;font-style:normal;font-weight:400;visibility:visible}.ff3{font-family:ff3;line-height:.904297;font-style:normal;font-weight:400;visibility:visible}@font-face{font-family:ff4;src:url(data:application/font-woff;base64,d09GRgABAAAAABFcAA8AAAAAIYQAAQAAAAAAAAAAAAAAAAAAAAAAAAAAAABGRlRNAAABWAAAABwAAAAcUDor6UdERUYAAAF0AAAAHQAAAB4AJwDKT1MvMgAAAZQAAABDAAAAYGDJCeBjbWFwAAAB2AAAAEoAAAFKQDjm4WN2dCAAAAIkAAAEGAAABQYv1fuFZnBnbQAABjwAAAM/AAAFn1066ANnbHlmAAAJfAAAAPsAAAEMOz5sxmhlYWQAAAp4AAAAMQAAADYaDNlRaGhlYQAACqwAAAAbAAAAJAm9B3pobXR4AAAKyAAAADgAAAJAKowBFWxvY2EAAAsAAAAAFAAAAYoymDJmbWF4cAAACxQAAAAgAAAAIAIaAHhuYW1lAAALNAAAAOoAAAG540R2EXBvc3QAAAwgAAACyQAACXHyCpukcHJlcAAADuwAAAJtAAADc1appT8AAAABAAAAANgScoUAAAAAo0i8OwAAAADU3v0oeJxjYGRgYOABYjEgZmJgBMLDQMwC5jEAAAv/APIAAAB4nGNgYV7HOIGBlYGB1Zh1JgMDoxyEZr7OkMYkxMDAxMDKzAAGDUBJBiQQkOaaAhRUUFBiDQXxISSKGgUGRgDgRQgNAHicY2BgYGaAYBkGRgYQcAHyGMF8FgYNIM0GpBkZmBgUFJT+/wfywfT/x/cfQdUDASMbA5zDyAQkmBhQASPEigEHLLQzGgAMEwk6AAB4nF1Uf0yWVRR+zjn3ft+nqUTNSqTEmTA0mW6OAgwza0xkSH4BImkiTi2WkZA/JhaD1cwCyZiUlr9CjFgBFQarADF/bFk5m6wpWqIhozJnTiP93tux/Kv32X2397733vM8z7nn2AWYYtMwRkekVGM04M7eGue9HPe7LcA471nXExMG4LNb478nD+OxELFIRRcuoZ0mIAOd7hjyMY9XY5LOb8Ln6MQZPIYlYERQCaLcu3gD0SjHTiSYCNeCNPQHwnAX7kciPQ8fRmIZtlMPZmG2npGEFLyGlfp+Quev0UP6hzAUCzR6NbahHd/hJ4zSE+PQTX665r7ATASVwzq04Yx91L6OO/Em9qIe+/ELxVEtDchF1+KOul91VyymIB65WKzYjF26bi++4XHyvotw69wH7ggilX2Dqt6PgxrrKkVRFuVznaz1/nYrXIP6MEw5K3vFDFWTjmLs0ZXduE5DFGUcxdM53wt3d8OPMYjCROWXiefwEjagQlVsxQ40op+m03L6li7ycC7lDpvhT/enD+kInXAp7qrGGIaxyjYbBVijOzfjLWzRnbs01teKSwhRPCVRMs2iubSJXqU99BdP5FN8XUZImDwgObJISqRXBgM2NMer8Y65DLdGvST1fKhmcqbqfBJPoRBFWI0SlCq7SkWVutegaFI/OxQHcBrnFH3ox2/EZFXjUJqgmKxIokcolTLpaVpGRVRD+6iV2ukgDdAVnsrxnMBzeC4v40Iu5ipu4mbu4PP8p7JMlMelSF6WBumSI3JcThqYVJNnnjEvmmrTZE6YS+aK8SzsOEWczbM7Q7u92V6ui3ZJbrGrcFWKfvX4PlUTjRjVk6FZzcdSvTmFihcUa9W7V1TRFmxX7266tw+t+FJvaZfm9xCO4aTqO41eXMOgmnNT30gaS5Noivr7MKUo5mueVlEJlVIlbVWfm6lF0Uk9qtJThVmcwwt5FZdwBdfwNm7jTu7WTDjxaSbukRSZLdmSKwulWLbI2/KObJcd0iqdcsiwSTQZZqUpN1Vmt2k0h80PpsdOtkl2o6LJttivbJ/vDt9o31Rf0Nfq9wXWBi4EPHyKw2hGC/730Aa6nZrxEV0QI6V8lOfxbdxNZeZ7itEMTCPYSqzAZWV4Lx3nBylb8mm++ldGSykX70mk7JZUHLUrKCgZtARBU4Mb9gDy7Eb+RNhulBANcgOWo5ILQvUuh0YgSLVcpzdmPaYh1kSgmxNMG43nWO7wf0ytSPb7JEESA2H6VSvnlGYwEEYDyJNerZ+zWltzuU57Qh/1+Ocou5A06pr1SKZaLxz1NocXUSTXUlqoPPSjbHM7aBT3AqHw0AyeqTcu033I7fgDNd6g+RntfAqZ2jXy/62cy1p7q7XTZOEGD9d6CmofKbTh/wAw22FPeJyNU0tv00AQ3nVCm6YpcZ9pEx5rlgRoEspThFCKqe2oKEIibZDsqgenSVDbEyekcuqlolrgP/ATxoVDeuMP8B84cASJC2eY3aRuzQFhWfb3mPHOzo5Ns/lo6eHig+r9yr27d27funlj4Xq5VJy/dvVKIX+ZXzLYxQvnz+Wyc7OZmempyYlxPX12LDWaHEkMD52JxzRKSg6v+QwKPsQLfGWlLDlvodA6JfjAUKpFY4D5KoxFI02MfPFXpNmPNMNIqrNFslguMYcz+GJz1qPrDRfxe5t7DH4o/FTheEGRMSSGgRnMmd2yGVCfOVB7tSUc38bvBaNJi1vdZLlEguQowlFEkOEvA5pZogpoGacaaCQxhlVBltsOzHFblgCxvNPqwLOG69g5w/DKJaBWm28C4cuQLqoQYqllYMiCYbUM25bbIW9ZUPos3vV0sukXUx3eaW24EGt5co3xIq5rQ+b1t9kTih+fsNw3p91cTDiz20xSId4w+NBwT7uGfHoefgNztXzNFzVc+h12sb7GcDVt33OB7uOSTO5E7qq/vy53pOLvMBjhy3xL7Ph4NlkBZHXXOMxmzaPfX0nWYaLpcgMe5bjXss8FU0Ss7n6cM9lc1CmXAn2839jgbHoAUmOnQTf0FFLhEtVXw85SWRF/ghMBrM2wEpfjniry0a0Q0a5gGF4exSzo4Ilsw4jlC70qdZkPZ/I6Z+IXwQngP75HldZAGcrrv4iEck7CWUP/GEOxCPPzckSGLTxTrHFJ8bvl0que9pi/1Bm+sH3kGfa25VUXsP2GIQ/4bc8km0hgr+H2OSObuUNiLhQ90HzpfD52pp9LZ+/YCdN9jpP8iVBCyDQkCuGd1mcmna0q0Jl/2N2+X1/j9ca6yxzhD3pbb0ZY36+E3gDBpOXGctoAabmYcnEoN8JgSdwUxPN4D6mh7vSGEziVSqGsBrq/0n96ScP4z6Te758yS71O0gZlQrUY5Q8iPFJeSsSw4HhBqzfXhUhGPPzBlwNODxqBSQ/W1t0jnRB20HQPNapZ/rIXXEbPPWKEmErVQlUyJhmpUxzYQy2hrNyRSciecuNKULzdo0RpiWONknZP62u60vAq/wFtXoZvAHicNY69SsNQHMXPvf/7YdVKAkVsB0n8Ailom6oIXmiEdEy2PkGEiI/hSzTvIAgJXdz6Ak5CJkdxK13EQZNiozgczuE3/DjgCAB+I8cgaJxkDKcm18Kbe5mSryYnvprIqMayxrlW96XJWc0HtmsfurYbcGd5wNLlrRx/PQTiGQDDHV5oRI/YgPsEYlN/q6HRaar2ZnPhHl/udLvRm/WOYTjv91hL7e8dnZ9dDLxtGhWTtCjSScGv/7pY+TgSQCQSvz+v/F2lY84gRUxYVzIm4p2GFjFDe62WR9aHCSsTWZ8mtCqDoalMnX7v/3QiUDo0K32Jbzhihh8IIEN7AHicY2BkYGBgZern8aj+Gs9v85VBnoMBBG6LHrOA0y4MDCzprKFALgcDE0gUAB1YCREAAAB4nGNgZGBgDWUAAnZZEMmSzsDIgApiABcfAUgAeJxjesPgwgAETKsYGJjXgXEWy1mGdJAYwy8wCZZj3cIwZAC7LO3MZv5Cnj6WFOq6Y7AAAFPoCMV4nGNgYNCBwhCGtlE4cBAAJfBk/wABAAAAxAAMAAIAAAAAAAIAEAAvAFUAAADuADsAAAAAeJyNjj1Ow0AQRp8TJwgFUQLlFkhUjpwVShGldkmBnPSRsrIsWba0cW5BzUk4BgfgHFyAfA5TUFBkR6N5s/PND3DDOwnDS5jxYDziimfjMU+8GafSfBpP1PttPGWW3EuZpNf6uTt3DTzilkfjMS+sjVNpPown2vplPNX/Dxtaemp5Q2BPKStg0/Z134R9WSp5VaXiKMWOqDRUx2YnKOjO3UOMUgQcnjm54kr+/+zfmpdlLOVe+sEpurYvulgF5+e5W7k/NyjzPltmPvcSXnLzVpXIQarhRsfC7mIb4qHuWrfQjotGnQChFkR1AAB4nG3T1dNWVRiG8ff6UAkDVOxCxVb89uotKipYCNiEjfLZ2IGJja0I2N3d3Qf8XYyOM/u+T3xm1sx1tH7zHDyjsdF/s2XFaNXo/2bzv4/R2GjSaB1jTGIrtmYbJjOFqUxjW7Zje3ZgOjPYkZ3YmZnswq7sxu7swZ7sxd7sw77sxyz25wAOZDYHcTCHcCiHcThHcCRHMYejGacjEElkCpVGzzHM5ViO43jmcQInchLzWcDJnMKpnMbpLOQMFrGYJZzJWZzNOZzLeZzPUpaxnBVcwIVcxMVcwqVcxkou5wpWMcGVXMXVXMO1XMf1rOYGbuQmbuYWbuU2bucO7mQNd3E393Av93E/a3mAB3mIh3mER3mMdTzOEzzJUzzNMzzLczzPel5gAxvZxIu8xMu8wqu8xuu8wZu8xdu8w7u8x/t8wId8xMd8wqd8xud8wZd8xdd8w7d8x/f8wI/8xM/8wq/8xu/8wZ/8xd9TlqxcPbF4Ys74EN0QYYg4RBoiD1GGqEO0Ifqpw4fjqk4VVFGVVFlVVFXVVDKCjCAjyAgygowgI8gIMoKMICPKiDKijCgjyogyoowoI8qIMpKMJCPJSDKSjCQjyUgykowkI8vIMrKMLCPLyDKyjCwjy8gyiowio8goMoqMIqPIKDKKjCKjyqgyqowqo8qoMqqMKqPKqDKajCajyWgymowmo8loMpqMJqOX0cvoZfQyehm9jF5GL6OX0ffTdIPjzs4ZnNGZnNlZnNXZnNY6a521zlpnrbPWWeusddY6a521YCKYCCaCiWAimAgmgolgInqhaC1ai9aitWgtWovWorVoLVlL1pK1ZC1ZS9aStWQtWUvWsrVsLVvL1rK1bC1by9aytWytWCvWirVirVgr1oq1Yq1YK9aqtWqtWqvWqrVqrVqr1qq1aq1Za9aatWatWWvWmrVmrVlr1nprffcPYXt3bwAAAHicbVJdaxNBFL2zjZ3phzVdQ1wNYVO2JrRrG8yDtbS0u9vdPrgQq4mYVcE0NdiCEkFbkEApSLUihgHBZx9LfZlNqGyKYn9Ki//B1zizRvzqXc65M+cMcwbu+kXZjEkZ/qWlNNRQHBDcD/l6yPMhZwVL2WZWVQNpsvlBtEvN5Bhvo8bA8QX1ckZWZzNif86YeTSmHu2dV485PmZy6s5sTn3BkeXY4HtxLrM3ptYytce1l7VXkSmIxwFAHiZGgL59uhXri/VN0QB9NaYx/YJpC9OHmD7A9Dami5hewXQSUx3Ti5iO4hiRSZQMkUHSTwjpJREiESCxoHNk6MCfHuuNitYbERwJ11FJMCfOICEiwTVgZ3tcyS1YyGWHK+BWUux7QQtQ/4077JRmISa74BYthV3V3QB3brIp3WV46W7JR6jhcZVJOwGCYilAHSFtJ5i8UGoDQp3tt4lu9zyIb8wr8/Lc8PSifQKVu6z/LkX/s9yl559BReuAOT9rYfUdFmqBqzRUqVBpqCpJ9t4tlNhe0mM5segkPdQy9426U9WcsuZUOcrszcaqwrYqqZRv7AsjxXrS5crKqujLVbavVW1maHbKN+sn2HVhm5rtQ90plvy6UbWbpmE62rLttSGPKv5446+417/i2jCOKv/fGKCKuHJcJOYbJyQ2hJ0XiQ2R2BCJeSMfJjprYoBLJZ+A5S3c+9lb0kA/n0U5MeJZ8eiTuXAwMyPKZuIgAmgXBnSPDWoWO80hrAlzwhQW/2GENcTlM11L2ZwZSRyg3a4V5fKwZoG+rv9TT0WB4qzZAvwl7c6htNWU1Zzu6T8AFgbsMwAAAA==) format("woff")}.ff4{font-family:ff4;line-height:.666504;font-style:normal;font-weight:400;visibility:visible}.ff5{font-family:ff5;line-height:.666504;font-style:normal;font-weight:400;visibility:visible}.m0{transform:matrix(.329234,0,0,.329234,0,0);-ms-transform:matrix(.329234,0,0,.329234,0,0);-webkit-transform:matrix(.329234,0,0,.329234,0,0)}.ls3{letter-spacing:-.196px}.ls1{letter-spacing:0}.ls2{letter-spacing:3.052000px}.ls0{letter-spacing:39.54712px}.sc0{text-shadow:-.015em 0 transparent,0 .015em transparent,.015em 0 transparent,0 -.015em transparent}@media screen and (-webkit-min-device-pixel-ratio:0){.sc0{-webkit-text-stroke:.015em transparent;text-shadow:none}}.ws2{word-spacing:-20.3136px}.ws0{word-spacing:-13.032160px}.ws1{word-spacing:-9.980160px}.ws3{word-spacing:-9.78416px}.ws4{word-spacing:0}._3{margin-left:-1.221211px}._1{width:1.777248px}._0{width:3.002562px}._2{width:4.858742px}.fc1{color:#2f5496}.fc2{color:#000}.fc0{color:#fff}.fs0{font-size:44.16px}.fs1{font-size:51.84px}.yf{bottom:285.590255px}.ye{bottom:311.230835px}.y0{bottom:311.454977px}.yd{bottom:526.62862px}.yc{bottom:556.365129px}.yb{bottom:771.486358px}.ya{bottom:790.608640px}.y9{bottom:810.520556px}.y8{bottom:830.274571px}.y7{bottom:850.186487px}.y6{bottom:870.098403px}.y5{bottom:889.852419px}.y4{bottom:909.764335px}.y3{bottom:940.106766px}.y2{bottom:960.176845px}.y1{bottom:989.570820px}.h2{height:31.696875px}.h4{height:32.063437px}.h3{height:35.4375px}.h1{height:695.999812px}.h0{height:1108.753381px}.w1{width:700.609082px}.w0{width:783.997366px}.x0{left:50.701973px}.x1{left:94.850617px}.x2{left:118.555436px}.x3{left:142.255395px}.x4{left:507.849412px}

DATA3404 Lecture Notes - Lecture 10: Mapreduce, Apache Spark, Runtime System

Not directly possible out of the box, needs some programming joins with mapreduce. Ideally via automated plan optimisation and scheduling: built on top of hadoop/hdfs, usable with existing jobs and data stores. In-memory framework for distributed, iterative computations: core: augment data flow model with resilient distributed dataset (rdd, rdd: fault-tolerance, in-memory storage abstraction. Rdds are created by: parallelizing an existing collection, referencing a dataset in an external storage system, such as hdfs. Rdds have partitions: based on source file partition (such as blocks of hdfs files, or created during transformation, repartition. Transformation: create a new dataset from an existing one, eg. map(func), flatmap(func), maptopairs(func), reducebykey(func) Action return a value to the driver program after running a computation on the data set: eg. count(), first(), collect(), saveastextfile(path) Most rdd operations take one or more functions as parameter: most of them can be viewed as higher order functions.

DATA3404 Lecture Notes - Lecture 10: Mapreduce, Apache Spark, Runtime System

Document Summary

Get access

Related Documents

CS431 Chapter Notes - Chapter 1: Abstract Data Type, Deadlock, Mapreduce